أعلنت Hunyuan عن إصدار HunyuanImage 3.0 والمصدر المفتوح - يقال إنه أكبر وأقوى نموذج رسم بياني مفتوح المصدر Wensheng حتى الآن ، بإجمالي أكثر من 80 مليار معلمة ، وسيتم تنشيط 13 مليار معلمة لكل رمز مميز أثناء الاستدلال. تأثيره قابل للمقارنة تماما مع أفضل نموذج مغلق المصدر في الصناعة. 🚀🚀🚀
ينشأ HunyuanImage 3.0 من نموذج اللغة الكبيرة متعدد الوسائط الأصلي المطور ذاتيا من Hunyuan ، وقد تم ضبطه وتدريبه لاحقا لمهام الرسم البياني Wensheng. يمنح هذا الأساس الفريد النموذج سلسلة من القدرات القوية: ✅ استخدم المعرفة العالمية للتفكير ✅ فهم المطالبات المعقدة بآلاف الكلمات ✅ إنشاء نص دقيق في الصور
على عكس نماذج توليد الصور التقليدية المستندة إلى DiT ، تتبنى بنية MoE الخاصة ب HunyuanImage 3.0 نهجا قائما على نقل الدم يجمع بعمق بين تدريب الانتشار وتدريب LLM لتشكيل نظام موحد وقوي.
يعتمد HunyuanImage 3.0 على Hunyuan-A13B ويتم تدريبه على مجموعة بيانات ضخمة: 5 مليارات زوج من الرسومات والنص ، وإطارات الفيديو ، وبيانات نصية رسومية متشابكة ، ومجموعة نصية من 6 تريليون رمز. يتيح هذا التدريب المختلط عبر إمكانات التوليد والفهم وإدارة الحقوق متعددة الوسائط للنموذج دمج مهام متعددة بسلاسة.
سواء كنت رساما أو مصمما أو منشئا ، فإنه يقلل من سير عملك من ساعات إلى دقائق. HunyuanImage 3.0 قادر على إنشاء نص معقد ورسوم هزلية مفصلة ورموز تعبيرية معبرة ورسوم توضيحية حية ومرحة للمحتوى التعليمي.
‏‎7.24‏K