Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Hunyuan annonce la publication et l'open source de HunyuanImage 3.0 - il est dit que c'est le plus grand et le plus puissant modèle de génération d'images open source à ce jour, avec un total de plus de 80 milliards de paramètres, et chaque token active 13 milliards de paramètres lors de l'inférence.
Ses performances peuvent rivaliser avec celles des meilleurs modèles fermés de l'industrie. 🚀🚀🚀
HunyuanImage 3.0 provient du modèle de langage multimodal natif développé en interne par Hunyuan, et a été affiné et entraîné pour des tâches de génération d'images à partir de texte.
Cette base unique confère au modèle une série de capacités puissantes :
✅ Utiliser des connaissances du monde pour le raisonnement
✅ Comprendre des invites complexes de milliers de mots
✅ Générer du texte précis dans les images
Contrairement aux modèles de génération d'images DiT traditionnels, l'architecture MoE de HunyuanImage 3.0 adopte une méthode basée sur la Transfusion, couplant profondément l'entraînement de la Diffusion et des LLM, formant ainsi un système puissant et unifié.
HunyuanImage 3.0 est basé sur Hunyuan-A13B, entraîné sur un vaste ensemble de données : 5 milliards de paires image-texte, des images vidéo, des données image-texte entrelacées, ainsi qu'un corpus textuel de 60 trillions de tokens.
Cet entraînement hybride à travers plusieurs modalités de génération, de compréhension et de capacités LLM permet au modèle d'intégrer sans effort plusieurs tâches.
Que vous soyez illustrateur, designer ou créateur, cela peut réduire votre flux de travail de plusieurs heures à quelques minutes.
HunyuanImage 3.0 peut générer des textes complexes, des bandes dessinées détaillées, des émoticônes expressives, ainsi que des illustrations vivantes et intéressantes pour le contenu éducatif.
7,25K
Meilleurs
Classement
Favoris