أعلنت شركة OpenAI رسمياً عن إطلاق مشروع جديد في مجال إنتاج الصوتيات باستخدام تقنيات الذكاء الاصطناعي المتقدمة، وذلك خلال فعاليات “يوم المطورين” DevDay الذي عُقد في سان فرانسيسكو مطلع أكتوبر 2025، بحضور الرئيس التنفيذي سام ألتمان وكبار المهندسين في الشركة.
وأوضحت OpenAI أن المشروع يهدف إلى توفير مجموعة من النماذج الصوتية الذكية القادرة على توليد صوت بشري واقعي وسينمائي في الوقت الفعلي، سواء للنصوص المحكية أو للمؤثرات الصوتية والموسيقى التفاعلية، حيث قدمت نموذجين صوتيين جديدين هما gpt-realtime-mini وSora 2. ويُعد gpt-realtime-mini نموذجاً مصغراً منخفض التكلفة لتوليد الصوت آنياً ومتوفر عبر واجهة API مخصصة لتطبيقات خدمة العملاء، التعليم، الترفيه، ومجالات صناعة المحتوى.
كما أطلقت OpenAI نظاماً لتوليد الأصوات والمقاطع الموسيقية والمؤثرات متزامنة مع المشاهد البصرية، من خلال تطوير Sora 2 القادر على مزامنة الحوار والمؤثرات الصوتية مع الصور والفيديو، ما يتيح للمبدعين إنتاج أفلام قصيرة وعروض تفاعلية غنية بالصوتيات بإمكانات غير مسبوقة عبر منصة واحدة.
وحسب بيان الشركة، يدعم النظام الجديد 12 صوتاً بشرياً افتراضياً و15 نمطاً عاطفياً (vibes)، مع التحكم الكامل بوتيرة النطق، التنغيم، والتوقفات الدرامية، ويتيح أيضاً إمكانيات متقدمة للترجمة والتوليف الموسيقي.
وأكدت OpenAI أنها تلتزم بمعايير سلامة صارمة تمنع إساءة استخدام التقنية في الاستنساخ غير المصرح للأصوات البشرية، إلى جانب أدوات رقابية وقوانين وقائية بالتعاون مع هيئات تنظيمية أمريكية وأوروبية.
ويمثل إطلاق هذا المشروع خطوة استراتيجية جديدة للمنافسة في سوق الصوتيات الاصطناعية، فيما تستهدف الشركة قطاع الإعلام، التعليم، إنتاج الكتب الصوتية، والتسويق الإلكتروني، مع دعم اللغات واللهجات العالمية وتخفيض كبير في أسعار الخدمة مقارنة بالمنافسين.




