أعلنت شركة OpenAI عن طرح تحديث جديد لنظام ChatGPT يتيح تحويل المحادثات الصوتية إلى تجربة بصرية متكاملة، وذلك عبر دمج عناصر مرئية تفاعلية مع ردود الذكاء الاصطناعي الصوتية. يتيح التحديث للمستخدمين التفاعل صوتيًا مع ChatGPT، والاستماع إلى ردوده مع عرض نص الحوار بشكل مباشر، بالإضافة إلى إمكانية مشاهدة عناصر بصرية مثل الخرائط أو الصور أو الشروحات التوضيحية أثناء سير المحادثة.
أبرز مزايا التحديث الجديد
- يعرض نص الحوار بشكل مباشر أثناء الحديث الصوتي، ما يسهل التحقق ومتابعة النقاط الرئيسية.
- يضم عناصر بصرية تفاعلية تظهر تلقائيًا عند طلب معلومات غرافية أو صور، أو عند الحاجة لتوضيح مرئي مرتبط بسياق المحادثة.
- يستخدم تقنيات متقدمة في التعرف على الكلام وتحويله لنص، كما يولد ردودًا صوتية طبيعية أقرب للنطق البشري.
آليات العمل والتطبيقات العملية
عند بدء محادثة صوتية مع ChatGPT يتم تحويل صوت المستخدم إلى نص، ثم تحليل السياق والإجابة بصوت اصطناعي واضح مع عرض النص الردي والعناصر البصرية المقترنة في نافذة واحدة، ما يمنح بعدًا حسيًا وتفاعليًا جديدًا للتجربة. يستطيع المستخدم طلب وصف معلم أو عرض خريطة أو أي صورة متعلقة بالموضوع لمزيد من الفائدة البصرية، ما يجعل التجربة التعليمية وتوليد الأفكار أسهل وأكثر تنوعًا، خاصةً لذوي الاحتياجات الخاصة والمتعلمين البصريين.
آراء المستخدمين والتوقعات المستقبلية
شهد التحديث ترحيبًا من المختصين والمستخدمين لما يقدمه من إمكانيات في التعليم وتطوير نطق اللغات واستخدام ChatGPT في صياغة البريد الإلكتروني أو تنظيم المهام أو حتى تطبيقات العصف الذهني الإبداعي. تعمل الشركة أيضًا على تطوير الطبقات الأمنية وتحسين دعم اللغات وتخصيص صوت ChatGPT بشكل أكبر في الإصدارات القادمة.




