DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Hunyuan anunciou o lançamento do HunyuanImage 3.0 e de código aberto - diz-se que é o maior e mais poderoso modelo gráfico Wensheng de código aberto até hoje, com um total de mais de 80 bilhões de parâmetros, e 13 bilhões de parâmetros serão ativados por token durante a inferência. Seu efeito é completamente comparável ao modelo de código fechado superior do setor. 🚀🚀🚀

O HunyuanImage 3.0 se origina do modelo de linguagem grande multimodal nativo autodesenvolvido pelo Hunyuan e foi ajustado e pós-treinado para tarefas gráficas de Wensheng. Essa base exclusiva dá ao modelo uma série de recursos poderosos: ✅ Use o conhecimento do mundo para raciocinar ✅ Entenda prompts complexos em milhares de palavras ✅ Gere texto preciso em imagens

Ao contrário dos modelos tradicionais de geração de imagens baseados em DiT, a arquitetura MoE do HunyuanImage 3.0 adota uma abordagem baseada em Transfusão que combina profundamente o treinamento de Difusão e LLM para formar um sistema unificado e poderoso.

O HunyuanImage 3.0 é baseado no Hunyuan-A13B e é treinado em um enorme conjunto de dados: 5 bilhões de pares de texto gráfico, quadros de vídeo, dados de texto gráfico intercalados e um corpus de texto de 6 trilhões de tokens. Esse treinamento híbrido em recursos de geração, compreensão e LLM multimodal permite que o modelo integre perfeitamente várias tarefas.

Seja você um ilustrador, designer ou criador, ele reduz seu fluxo de trabalho de horas para minutos. O HunyuanImage 3.0 é capaz de gerar textos complexos, quadrinhos detalhados, emojis expressivos e ilustrações vívidas e divertidas para conteúdo educacional.

7,25K

Melhores

Classificação

Favoritos