أعلن باحثون في مجال الذكاء الاصطناعي عن تطوير نموذج جديد قادِر على تحويل الأفكار والأوصاف النصية إلى مقاطع فيديو واقعية خلال ثوانٍ، في خطوة تُعدّ من أبرز الاختراقات في توليد المحتوى المرئي بالذكاء الاصطناعي. ويُتوقع أن تُغيّر هذه التقنية طريقة عمل صناعة السينما، والإعلانات، والتعليم الرقمي، وتصميم المحتوى على منصات التواصل الاجتماعي، عبر اختصار خطوات التصوير والتحرير التقليدية.
كيف يعمل النموذج الجديد؟
يعتمد النموذج الجديد على مزيج من تقنيات التعلم العميق (Deep Learning) ونمذجة النصوص إلى صور وفيديو (Text‑to‑Video)، بحيث يُحوّل وصفًا مكتوبًا مثل:
“أغنية فيديو كليب لسيارة فضائية تطير في سماء الليل فوق مدينة مستقبلية”
إلى مقطع فيديو متكامل مع حركة الكاميرا، ومؤثرات بصرية، وانتقالات سينمائية شبه واقعية. ويُميّز هذا النموذج سرعة المعالجة، ووضوح التفاصيل، وانسجام الحركة بين الإطارات، ما يقلّل من الحاجة إلى تعديلات يدوية بعد التوليد.
تطبيقات مثيرة في مجالات مختلفة
- الإنتاج الإبداعي والسينما: يتيح للمخرجين وصناع المحتوى إنشاء “مقاطع بروتوفيديو” خلال ثوانٍ لتجربة أفكار، ثم تطويرها لاحقًا.
- الإعلانات والتسويق: يُمكن العلامات التجارية من توليد إعلانات تركّز على منتج أو خدمة بمجرد إدخال وصف قصير، دون الحاجة إلى فرق تصوير معقدة.
- التعليم والتدريب الرقمي: تُولد مقاطع فيديو توضيحية مخصصة للمناهج أو التدريبات المهنية، بما يُعزّز تجربة التعلّم التفاعلية.
- التصميم والألعاب: يُستخدم كمحرك مساعِد لتوليد محتوى سريع للشخصيات، والأماكن، والمؤثرات ثلاثية الأبعاد.
تحدّيات أخلاقية وتقنية
رغم الإبهار التقني، يُثار جدل حول استخدامات مزورة للنموذج في صناعة مقاطع مزيفة (deepfakes) ونشر معلومات زائفة، ومخاوف تتعلّق بحقوق الملكية الفكرية للمحتوى المرئي المولّد آليًا. ويعمل المطورون على إضافة آليات تحقق مثل العلامات الرقمية، وقيود التصدير، وقيود الاستخدام، لضمان الاستخدامات الأخلاقية والقانونية.




