تعرف على نموذج توليد الفيديو Wan2.1-FLF2V-14B من علي بابا – مفتوح المصدر، بدقة 720p، ويدعم التوليد بالنصوص والصور. مثالي للمصممين، المبرمجين، وصنّاع المحتوى.
في خطوة بارزة نحو تعزيز قدراتها في مجال الذكاء الاصطناعي، كشفت شركة علي بابا عن نموذجها المفتوح المصدر Wan2.1-FLF2V-14B، ضمن سلسلة Wan 2.1 المتخصصة في توليد الفيديو عالي الدقة. تم الإعلان عن هذا النموذج في فبراير 2025 وهو متاح الآن بموجب رخصة Apache 2.0، مما يمنح المطورين والمبدعين حرية استخدامه وتعديله دون قيود مالية.
ما هو Wan2.1-FLF2V-14B؟
هو نموذج ذكاء اصطناعي متقدم يركز على توليد فيديوهات مدتها 5 ثوانٍ بدقة 720p، باستخدام صورتين فقط: الإطار الأول والأخير. يقوم النموذج بملء الإطارات المتوسطة تلقائيًا لضمان سلاسة الحركة واتساق المشاهد. يعتمد على تقنيات مثل:
- CLIP لاستخلاص الميزات الدلالية.
- DiT (محولات الانتشار) لتحسين جودة الصورة والاستقرار.
- تم تدريبه على أكثر من 150 مليون فيديو ومليار صورة.
أبرز ميزاته:
- تحكم ذكي بالإطارات: يمكنك تحديد بداية ونهاية الفيديو بصورتين فقط.
- دقة وواقعية عالية: يدعم توليد فيديوهات بجودة بصرية فائقة.
- مرونة الاستخدام: يقبل مدخلات نصية أو صورية، مثالي للإعلانات، الألعاب، والأفلام.
- تشغيل على RTX 4090: بذاكرة تبدأ من 8.19 جيجابايت وزمن توليد يبلغ 8 دقائق للفيديو الواحد.
لماذا هو مهم؟
حاز النموذج على إشادة واسعة من مجتمع الذكاء الاصطناعي، وحقق تصنيفًا متميزًا على VBench بنسبة 86.22%، متفوقًا في:
- ديناميكية الحركة
- العلاقات المكانية
- التفاعلات بين الأجسام
- كما يُعد بديلًا قويًا للنماذج المغلقة مثل Sora من OpenAI، بفضل كونه مفتوح المصدر ومتاح مجانًا.
كيف يمكن تجربته؟
- المنصات المتاحة: GitHub، Hugging Face، ModelScope.
- واجهة استخدام سهلة: مزود بواجهة Gradio وتعليمات مفصلة.
- برنامج تجريبي مجاني: أطلقته مختبرات Tongyi، يتيح الوصول للنموذج عبر التسجيل ومهام إبداعية.
الأثر على المصممين وصناع المحتوى
أشار العديد من المصممين عبر منصة X إلى أن Wan2.1-FLF2V-14B يمكن أن يُحدث ثورة في صناعة المحتوى المرئي، بتوفير أدوات احترافية تقلل التكاليف وتسرّع الإنتاج دون الحاجة إلى برمجيات معقدة أو فرق إنتاج كبيرة.
تحديات واعتبارات:
- العتاد المطلوب: النموذج يحتاج إلى قدرات حسابية عالية، والمجتمع التقني يطالب بإصدارات أقل استهلاكًا للموارد.
- الاعتبارات الأخلاقية: ضرورة وجود أدوات رقابة لمنع الاستخدام غير الأخلاقي أو انتهاك حقوق النشر.
في سياق أكبر:
تأتي هذه الخطوة ضمن استراتيجية علي بابا الضخمة، حيث تستثمر 52 مليار دولار في الذكاء الاصطناعي، بعد نجاحات مثل إطلاق نموذج Qwen-7B في 2023. Wan2.1-FLF2V-14B هو تأكيد على التزام الشركة بإتاحة الذكاء الاصطناعي للمجتمع العالمي، ودفع عجلة الابتكار والإبداع.
تعليقات: (0) إضافة تعليق