“اختبار ذكاء يكشف: نموذج OpenAI o3 يتفوّق على البشر وكل منافسيه!”

نموذج OpenAI o3 يتفوق على البشر وجميع النماذج المنافسة في اختبارات الذكاء والاستدلال، محققًا نتائج غير مسبوقة في عالم الذكاء الاصطناعي.

فريق التحرير

يوليو 4, 2025

مشهد تعبيري يوضح تفوق الذكاء الاصطناعي على البشر في اختبارات الذكاء والمنطق

ملخص المقال

إنتاج AI

أظهر نموذج OpenAI o3 تفوقًا ملحوظًا في اختبارات الذكاء، متجاوزًا البشر والنماذج المنافسة في اختبارات الذكاء والاستدلال المنطقي. حقق o3 نسبة نجاح 85% في اختبار ARC-AGI، ومعدل ذكاء 136 في اختبار Mensa Norway، وتفوق في البرمجة والرياضيات، مما يمثل تقدمًا كبيرًا في مجال الذكاء الاصطناعي.

النقاط الأساسية

تفوّق نموذج OpenAI o3 على البشر والنماذج المنافسة باختبارات الذكاء.
حقق o3 نسبة نجاح 85% باختبار ARC-AGI، متجاوزًا متوسط الأداء البشري.
سجل o3 معدل ذكاء 136 باختبار Mensa Norway، ضمن أعلى 2% من البشر.

شهد عالم الذكاء الاصطناعي نقلة نوعية مع إعلان نتائج اختبارات الذكاء الأخيرة، حيث تفوّق نموذج OpenAI o3 على البشر وجميع النماذج المنافسة في اختبارات قياس الذكاء والاستدلال المنطقي.

نتائج مذهلة في اختبارات الذكاء

تفوق على البشر في اختبار ARC-AGI:
حقق o3 نسبة نجاح بلغت 85% في اختبار ARC-AGI، وهو اختبار صُمم لقياس الذكاء العام وقدرة النماذج على التكيف مع مسائل جديدة، متجاوزًا بذلك متوسط الأداء البشري الذي يبلغ 75%، وأعلى بكثير من أفضل النماذج السابقة التي لم تتجاوز 55%.
نتائج استثنائية في اختبارات الذكاء العالمية:
سجل o3 معدل ذكاء (IQ) بلغ 136 في اختبار Mensa Norway، ما يضعه ضمن أعلى 2% من البشر حول العالم، متجاوزًا عتبة الانضمام إلى منظمة مينسا العالمية.
تفوق في البرمجة والرياضيات:
أحرز o3 نتائج متقدمة في اختبارات البرمجة (Code forces) بحصوله على تصنيف Elo بلغ 2727، وهو ما يعادل ترتيب أفضل 175 مبرمجًا بشريًا عالميًا. كما حقق 91.6% في اختبار AIME للرياضيات، متفوقًا على جميع النماذج السابقة.

ما الذي يميز نموذج o3؟

قدرات استدلال متقدمة:
يعتمد o3 على تقنيات “التفكير المتسلسل” و”الاستدلال المحاكى”، ما يمكّنه من تحليل المشكلات بعمق قبل تقديم الإجابة، ويمنحه مرونة في التعامل مع مسائل جديدة ومعقدة.
تطور في فهم السياق:
يستطيع النموذج معالجة معلومات معقدة ومتعددة الخطوات، والتكيف مع تغييرات السياق بشكل يفوق النماذج التقليدية.
تفوق على جميع المنافسين:
في جميع اختبارات الذكاء والاستدلال، تصدّر o3 الترتيب متفوقًا على نماذج مثل GPT-4o وأقوى النماذج مفتوحة المصدر، ليصبح معيارًا جديدًا في الذكاء الاصطناعي.

جدول مقارنة بين o3 والبشر والنماذج المنافسة

الاختبار	o3	البشر (متوسط)	أفضل نموذج سابق
ARC-AGI (%)	85	75	55
IQ (Mensa Norway)	136	100	116
Codeforces (Elo)	2727	2700 (Top 175)	1891
AIME رياضيات (%)	91.6	74.3	71.8

ماذا تعني هذه النتائج؟

اقتراب الذكاء الاصطناعي من الذكاء البشري العام:
يرى خبراء الذكاء الاصطناعي أن هذه النتائج تمثل خطوة كبيرة نحو تحقيق الذكاء الاصطناعي العام (AGI)، حيث أصبح بإمكان النماذج الحديثة حل مسائل لم تكن ممكنة سابقًا إلا للبشر.
تساؤلات حول مستقبل الذكاء الاصطناعي:
مع هذا التفوق، تزداد التساؤلات حول كيفية استخدام هذه القدرات، وأثرها على سوق العمل والتعليم، وأهمية وضع ضوابط أخلاقية وتقنية لاستخدام الذكاء الاصطناعي المتقدم.