شهد عالم الذكاء الاصطناعي نقلة نوعية مع إعلان نتائج اختبارات الذكاء الأخيرة، حيث تفوّق نموذج OpenAI o3 على البشر وجميع النماذج المنافسة في اختبارات قياس الذكاء والاستدلال المنطقي.
نتائج مذهلة في اختبارات الذكاء
- تفوق على البشر في اختبار ARC-AGI:
حقق o3 نسبة نجاح بلغت 85% في اختبار ARC-AGI، وهو اختبار صُمم لقياس الذكاء العام وقدرة النماذج على التكيف مع مسائل جديدة، متجاوزًا بذلك متوسط الأداء البشري الذي يبلغ 75%، وأعلى بكثير من أفضل النماذج السابقة التي لم تتجاوز 55%. - نتائج استثنائية في اختبارات الذكاء العالمية:
سجل o3 معدل ذكاء (IQ) بلغ 136 في اختبار Mensa Norway، ما يضعه ضمن أعلى 2% من البشر حول العالم، متجاوزًا عتبة الانضمام إلى منظمة مينسا العالمية. - تفوق في البرمجة والرياضيات:
أحرز o3 نتائج متقدمة في اختبارات البرمجة (Code forces) بحصوله على تصنيف Elo بلغ 2727، وهو ما يعادل ترتيب أفضل 175 مبرمجًا بشريًا عالميًا. كما حقق 91.6% في اختبار AIME للرياضيات، متفوقًا على جميع النماذج السابقة.
ما الذي يميز نموذج o3؟
- قدرات استدلال متقدمة:
يعتمد o3 على تقنيات “التفكير المتسلسل” و”الاستدلال المحاكى”، ما يمكّنه من تحليل المشكلات بعمق قبل تقديم الإجابة، ويمنحه مرونة في التعامل مع مسائل جديدة ومعقدة. - تطور في فهم السياق:
يستطيع النموذج معالجة معلومات معقدة ومتعددة الخطوات، والتكيف مع تغييرات السياق بشكل يفوق النماذج التقليدية. - تفوق على جميع المنافسين:
في جميع اختبارات الذكاء والاستدلال، تصدّر o3 الترتيب متفوقًا على نماذج مثل GPT-4o وأقوى النماذج مفتوحة المصدر، ليصبح معيارًا جديدًا في الذكاء الاصطناعي.
جدول مقارنة بين o3 والبشر والنماذج المنافسة
الاختبار | o3 | البشر (متوسط) | أفضل نموذج سابق |
---|---|---|---|
ARC-AGI (%) | 85 | 75 | 55 |
IQ (Mensa Norway) | 136 | 100 | 116 |
Codeforces (Elo) | 2727 | 2700 (Top 175) | 1891 |
AIME رياضيات (%) | 91.6 | 74.3 | 71.8 |
ماذا تعني هذه النتائج؟
- اقتراب الذكاء الاصطناعي من الذكاء البشري العام:
يرى خبراء الذكاء الاصطناعي أن هذه النتائج تمثل خطوة كبيرة نحو تحقيق الذكاء الاصطناعي العام (AGI)، حيث أصبح بإمكان النماذج الحديثة حل مسائل لم تكن ممكنة سابقًا إلا للبشر. - تساؤلات حول مستقبل الذكاء الاصطناعي:
مع هذا التفوق، تزداد التساؤلات حول كيفية استخدام هذه القدرات، وأثرها على سوق العمل والتعليم، وأهمية وضع ضوابط أخلاقية وتقنية لاستخدام الذكاء الاصطناعي المتقدم.
نموذج o3 من OpenAI لم يعد فقط ينافس البشر، بل أصبح يتفوق عليهم في اختبارات الذكاء والاستدلال، ليعلن عن بداية عصر جديد في الذكاء الاصطناعي.