Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Hunyuan anunciou o lançamento do HunyuanImage 3.0 e de código aberto - diz-se que é o maior e mais poderoso modelo gráfico Wensheng de código aberto até hoje, com um total de mais de 80 bilhões de parâmetros, e 13 bilhões de parâmetros serão ativados por token durante a inferência.
Seu efeito é completamente comparável ao modelo de código fechado superior do setor. 🚀🚀🚀
O HunyuanImage 3.0 se origina do modelo de linguagem grande multimodal nativo autodesenvolvido pelo Hunyuan e foi ajustado e pós-treinado para tarefas gráficas de Wensheng.
Essa base exclusiva dá ao modelo uma série de recursos poderosos:
✅ Use o conhecimento do mundo para raciocinar
✅ Entenda prompts complexos em milhares de palavras
✅ Gere texto preciso em imagens
Ao contrário dos modelos tradicionais de geração de imagens baseados em DiT, a arquitetura MoE do HunyuanImage 3.0 adota uma abordagem baseada em Transfusão que combina profundamente o treinamento de Difusão e LLM para formar um sistema unificado e poderoso.
O HunyuanImage 3.0 é baseado no Hunyuan-A13B e é treinado em um enorme conjunto de dados: 5 bilhões de pares de texto gráfico, quadros de vídeo, dados de texto gráfico intercalados e um corpus de texto de 6 trilhões de tokens.
Esse treinamento híbrido em recursos de geração, compreensão e LLM multimodal permite que o modelo integre perfeitamente várias tarefas.
Seja você um ilustrador, designer ou criador, ele reduz seu fluxo de trabalho de horas para minutos.
O HunyuanImage 3.0 é capaz de gerar textos complexos, quadrinhos detalhados, emojis expressivos e ilustrações vívidas e divertidas para conteúdo educacional.
7,25K
Melhores
Classificação
Favoritos