DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Hunyuan tillkännagav lanseringen av HunyuanImage 3.0 och öppen källkod - det sägs vara den största och mest kraftfulla Wensheng-grafmodellen med öppen källkod hittills, med totalt mer än 80 miljarder parametrar, och 13 miljarder parametrar kommer att aktiveras per token under inferens. Dess effekt är helt jämförbar med branschens bästa modell med sluten källkod. 🚀🚀🚀

HunyuanImage 3.0 härstammar från Hunyuans egenutvecklade inhemska multimodala stora språkmodell och har finjusterats och eftertränats för Wensheng-grafuppgifter. Den här unika grunden ger modellen en rad kraftfulla funktioner: ✅ Använd världskunskap för att resonera ✅ Förstå komplexa uppmaningar med tusentals ord ✅ Generera korrekt text i bilder

Till skillnad från traditionella DiT-baserade bildgenereringsmodeller antar HunyuanImage 3.0:s MoE-arkitektur ett transfusionsbaserat tillvägagångssätt som djupt kopplar samman diffusion och LLM-träning för att bilda ett enhetligt och kraftfullt system.

HunyuanImage 3.0 är baserad på Hunyuan-A13B och är tränad på en enorm datamängd: 5 miljarder grafik-textpar, videoramar, interfolierad grafik-textdata och en textkorpus på 6 biljoner tokens. Denna hybridträning över multimodal generering, förståelse och LLM-funktioner gör det möjligt för modellen att sömlöst integrera flera uppgifter.

Oavsett om du är illustratör, designer eller kreatör minskar det ditt arbetsflöde från timmar till minuter. HunyuanImage 3.0 kan generera komplex text, detaljerade serier, uttrycksfulla emojis och levande och lekfulla illustrationer för utbildningsinnehåll.

7,2K

Topp

Rankning

Favoriter