“أوبن إيه.آي” تضيف خاصية ذكاء اصطناعي صوتي جديدة

تقنية جي.بي.تي 5 تسمح بمحاكاة صوتية واقعية وتفاعلية.

فريق التحرير

ملخص المقال

إنتاج AI

أعلنت OpenAI عن إضافة ميزات ذكاء اصطناعي صوتي لواجهة برمجة التطبيقات الخاصة بها، بما في ذلك محاكاة صوتية واقعية، وترجمة فورية لأكثر من 70 لغة، وتحويل الكلام إلى نص، مما يتيح للمطورين إنشاء تطبيقات تفاعلية صوتيًا.

النقاط الأساسية

  • أوبن أيه.آي تطلق خصائص صوتية جديدة لمطوري التطبيقات.
  • تقنية جي.بي.تي 5 تسمح بمحاكاة صوتية واقعية وتفاعلية.
  • ترجمة فورية لأكثر من 70 لغة وتحويل الصوت إلى نص.

أعلنت شركة تطبيقات الذكاء الاصطناعي الأمريكية “أوبن إيه.آي” إضافة عدد من خصائص الذكاء الاصطناعي الصوتي إلى واجهة برمجة التطبيقات (أيه.بي.آي) الخاصة بها لمساعدة المطورين على إنشاء تطبيقات قادرة على التحدث مع المستخدمين، وكتابة النصوص، وترجمة المحادثات.

“جي.بي.تي 5” والجيل الجديد من المحاكاة الصوتية

وأشارت الشركة إلى أن خاصية “جي.بي.تي-ريال تايم 2” مصممة لإنشاء محاكاة صوتية واقعية قادرة على التفاعل مع المستخدمين، إلا أنها، طوّرت، على عكس الجيل السابق “جي.بي.تي-ريال تايم 1.5″، باستخدام تقنية “جي.بي.تي 5” التي تقول “أوبن أيه.آي” إنها مصصمة للتعامل مع طلبات المستخدمين الأشد تعقيداً.

الترجمة الفورية وتحويل النصوص: آفاق لغوية جديدة

كما تطلق الشركة أيضاً خاصية “جي.بي.تي ريال تايم ترانسليت” المصممة لتقديم خدمات ترجمة فورية لمحادثات المستخدم، حيث تشمل أكثر من 70 لغة إدخال (اللغات التي تفهمها الخاصية)، و13 لغة إخراج (اللغات التي تتم الترجمة إليها). وبالتوازي مع ذلك، أطلقت الشركة خاصية جديدة لتحويل الأصوات إلى نصوص باسم “جي.بي.تي ريال تايم ويسبر” والتي تتيح للمستخدم تحويل الحديث إلى نص فوراً أثناء التفاعل بين المستخدم والتطبيق.

من التواصل البسيط إلى الواجهات الصوتية الذكية

Advertisement

وقالت “أوبن أيه.آي” إن هذه الخصائص تنقل الحديث المسموع المباشر من مجرد اتصال ورد بسيط إلى واجهة صوتية تستطيع فعلياً القيام بالاستماع والتفكير والترجمة وتحويل الحديث إلى نص وجعل العملية محادثة غير محدودة.