أطلقت شركة Kling الصينية نموذجاً جديداً يحمل اسم “Video O1”، تصفه بأنه أول نموذج موحّد في العالم يجمع بين إنتاج الفيديو وتحريره وفهمه داخل منظومة ذكاء اصطناعي واحدة، ما يلغي الحاجة لاستخدام أدوات وبرامج منفصلة في سلسلة العمل المرئي.
ما هو نموذج Video O1؟
تقول شركة Kling إن Video O1 هو نموذج فيديو متعدد الوسائط “all‑in‑one”، قادر على التعامل في الوقت نفسه مع مدخلات نصية وصور ومقاطع فيديو، ثم توليد مقاطع جديدة أو تعديل القائمة بدقة ضمن بيئة واحدة.
يركز النموذج على دمج ثلاث مهام رئيسية في منصة موحّدة هي: توليد الفيديو من الصفر، والتحرير والتحكم التفصيلي في المحتوى، بالإضافة إلى “فهم” محتوى الفيديو بما يسمح بتعديلات معقّدة وسياقية.
قدرات إنتاج وتحرير الفيديو
يوفّر Video O1 إمكانية إنشاء مقاطع فيديو قصيرة من بضع ثوانٍ بالاعتماد على أوامر نصية أو صور مرجعية، مع الحفاظ على تماسك الشخصيات والعناصر البصرية بين اللقطات المختلفة.
كما يتيح للمستخدم تنفيذ تعديلات احترافية مثل استبدال الشخصيات، تغيير الخلفيات، إزالة عناصر غير مرغوبة من المشهد، أو تحويل أجواء المشهد (مثل الانتقال من نهار إلى غروب) مع الحفاظ على باقي تفاصيل الفيديو.
موقعه في سباق نماذج الفيديو التوليدية
تقدّم Kling نموذج Video O1 كمنافس مباشر لنماذج دولية مثل Sora من OpenAI وVeo من جوجل وRunway من الشركات الناشئة، وتؤكد أن اختبارات داخلية أظهرت تفوقه في بعض مهام توليد الفيديو من الصور.
إعلان النموذج يأتي ضمن موجة صينية أوسع في قطاع الفيديو التوليدي، تشمل نماذج أخرى مثل Wan 2.1‑VACE من علي بابا، وVidu من شركات صينية منافسة، في محاولة واضحة لاقتحام سوق إنتاج المحتوى العالمي بالذكاء الاصطناعي.




