أطلقت جوجل ديب مايند جيني 3 كنموذج عالم تفاعلي متطور يشكل خطوة محورية في تطوير الذكاء الاصطناعي العام، حيث يتيح إنشاء بيئات ثلاثية الأبعاد تتفاعل في الزمن الحقيقي مع محاكاة فيزيائية دقيقة، وفقا لموقع تك كرانش.
تقنيات التوليد واستمرارية المشاهد
يعمل جيني 3 بطريقة توليد الإطارات المتسلسل، ما يمكّنه من تذكر المشاهد السابقة وضمان استمراريتها الفيزيائية. ويدعم دقة عرض 720p بمعدل 24 إطاراً في الثانية، مقارنة بـ360p في جيني 2.
دمج القدرات والتحكم النصي
يجمع جيني 3 بين مزايا جيني 2 وVeo 3، مستفيداً من قدراته الاستقرائية لفهم الفيزياء دون محرك صلب. كما يتيح التحكم بالأحداث داخل البيئة بالنصوص، مثل إضافة عناصر أو تغيير الطقس، ما يوسع استخداماته في الألعاب والتصميم.
منصة لتدريب وكلاء الذكاء الاصطناعي
يعتبر جيني 3 منصة مهمة لتدريب الوكلاء القادرين على التعلم الذاتي، عبر سيناريوهات افتراضية تحاكي مواقف جديدة. ويرى باحثو ديب مايند أن هذه النماذج أساسية للوصول إلى ذكاء اصطناعي عام يتسم بالوكالة الجسدية.
تمكنت جيني 3 من إطالة زمن المحاكاة إلى دقائق متصلة، مقارنة بـ10–20 ثانية في جيني 2، بفضل ذاكرته التي تقلل تشويه المشاهد مع مرور الوقت.
دقة التفاعل الفيزيائي
يوفر جيني 3 قدرة شبه بشرية على توقع حركة الأجسام، مثل سقوط كوب أو تجنب عقبات متحركة، دون الاعتماد على محرك فيزيائي صلب، مما يعزز مرونته وإمكانية التعلم.
التحديات المستقبلية
لا يزال جيني 3 في مرحلة المعاينة البحثية وغير متاح للعامة. وتواجهه تحديات في محاكاة المواقع الواقعية بدقة ودعم النصوص داخل المشاهد، إضافة إلى الحاجة لإطالة زمن المحاكاة إلى ساعات.