المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أعلنت Hunyuan عن إصدار HunyuanImage 3.0 والمصدر المفتوح - يقال إنه أكبر وأقوى نموذج رسم بياني مفتوح المصدر Wensheng حتى الآن ، بإجمالي أكثر من 80 مليار معلمة ، وسيتم تنشيط 13 مليار معلمة لكل رمز مميز أثناء الاستدلال.
تأثيره قابل للمقارنة تماما مع أفضل نموذج مغلق المصدر في الصناعة. 🚀🚀🚀
ينشأ HunyuanImage 3.0 من نموذج اللغة الكبيرة متعدد الوسائط الأصلي المطور ذاتيا من Hunyuan ، وقد تم ضبطه وتدريبه لاحقا لمهام الرسم البياني Wensheng.
يمنح هذا الأساس الفريد النموذج سلسلة من القدرات القوية:
✅ استخدم المعرفة العالمية للتفكير
✅ فهم المطالبات المعقدة بآلاف الكلمات
✅ إنشاء نص دقيق في الصور
على عكس نماذج توليد الصور التقليدية المستندة إلى DiT ، تتبنى بنية MoE الخاصة ب HunyuanImage 3.0 نهجا قائما على نقل الدم يجمع بعمق بين تدريب الانتشار وتدريب LLM لتشكيل نظام موحد وقوي.
يعتمد HunyuanImage 3.0 على Hunyuan-A13B ويتم تدريبه على مجموعة بيانات ضخمة: 5 مليارات زوج من الرسومات والنص ، وإطارات الفيديو ، وبيانات نصية رسومية متشابكة ، ومجموعة نصية من 6 تريليون رمز.
يتيح هذا التدريب المختلط عبر إمكانات التوليد والفهم وإدارة الحقوق متعددة الوسائط للنموذج دمج مهام متعددة بسلاسة.
سواء كنت رساما أو مصمما أو منشئا ، فإنه يقلل من سير عملك من ساعات إلى دقائق.
HunyuanImage 3.0 قادر على إنشاء نص معقد ورسوم هزلية مفصلة ورموز تعبيرية معبرة ورسوم توضيحية حية ومرحة للمحتوى التعليمي.
7.24K
الأفضل
المُتصدِّرة
التطبيقات المفضلة