DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Hunyuan annonce la publication et l'open source de HunyuanImage 3.0 - il est dit que c'est le plus grand et le plus puissant modèle de génération d'images open source à ce jour, avec un total de plus de 80 milliards de paramètres, et chaque token active 13 milliards de paramètres lors de l'inférence. Ses performances peuvent rivaliser avec celles des meilleurs modèles fermés de l'industrie. 🚀🚀🚀

HunyuanImage 3.0 provient du modèle de langage multimodal natif développé en interne par Hunyuan, et a été affiné et entraîné pour des tâches de génération d'images à partir de texte. Cette base unique confère au modèle une série de capacités puissantes : ✅ Utiliser des connaissances du monde pour le raisonnement ✅ Comprendre des invites complexes de milliers de mots ✅ Générer du texte précis dans les images

Contrairement aux modèles de génération d'images DiT traditionnels, l'architecture MoE de HunyuanImage 3.0 adopte une méthode basée sur la Transfusion, couplant profondément l'entraînement de la Diffusion et des LLM, formant ainsi un système puissant et unifié.

HunyuanImage 3.0 est basé sur Hunyuan-A13B, entraîné sur un vaste ensemble de données : 5 milliards de paires image-texte, des images vidéo, des données image-texte entrelacées, ainsi qu'un corpus textuel de 60 trillions de tokens. Cet entraînement hybride à travers plusieurs modalités de génération, de compréhension et de capacités LLM permet au modèle d'intégrer sans effort plusieurs tâches.

Que vous soyez illustrateur, designer ou créateur, cela peut réduire votre flux de travail de plusieurs heures à quelques minutes. HunyuanImage 3.0 peut générer des textes complexes, des bandes dessinées détaillées, des émoticônes expressives, ainsi que des illustrations vivantes et intéressantes pour le contenu éducatif.

7,25K

Meilleurs

Classement

Favoris