نموذج O1 الجديد من OpenAI أبطأ عن قصد

أعلنت OpenAI عن أحدث نموذج للذكاء الاصطناعي يسمى O1، والذي تدعي الشركة أنه يمكنه أداء مهام التفكير المعقدة بشكل أكثر فعالية من سابقاته. يأتي الإصدار في الوقت الذي تواجه فيه OpenAI منافسة متزايدة في السباق لتطوير أنظمة ذكاء اصطناعي أكثر تطوراً.

تم تدريب O1 على “قضاء المزيد من الوقت في التفكير في المشكلات قبل الاستجابة لها، تمامًا كما يفعل الشخص”، كما قالت OpenAI على موقعها على الإنترنت. “من خلال التدريب، تتعلم [النماذج] تحسين عملية تفكيرها، وتجربة استراتيجيات مختلفة، والتعرف على أخطائها”. تتخيل OpenAI أن النموذج الجديد يستخدمه باحثو الرعاية الصحية لشرح بيانات تسلسل الخلايا، من قبل الفيزيائيين لإنشاء صيغ رياضية ومطوري البرامج.

أنظمة الذكاء الاصطناعي الحالية هي في الأساس إصدارات أكثر تطوراً من الإكمال التلقائي، وتوليد الاستجابات من خلال الإحصائيات بدلاً من “التفكير” فعليًا في سؤال، مما يعني أنها أقل “ذكاءً” مما تبدو عليه. على سبيل المثال، عندما حاولت شركة Engadget جعل ChatGPT وبرمجيات الدردشة الأخرى التي تعمل بالذكاء الاصطناعي تحل لعبة New York Times Spelling Bee، فقد أخطأت وأسفرت عن نتائج غير منطقية.

مع o1، تدعي الشركة أنها “تعيد العداد إلى 1” بنوع جديد من نموذج الذكاء الاصطناعي المصمم للانخراط فعليًا في حل المشكلات المعقدة والتفكير المنطقي. في منشور مدونة يوضح النموذج الجديد، قالت شركة OpenAI إنه يعمل بشكل مشابه لطلاب الدكتوراه في مهام معيارية صعبة في الفيزياء والكيمياء والأحياء، ويتفوق في الرياضيات والترميز. على سبيل المثال، حل نموذجها الرائد الحالي، GPT-4o، بشكل صحيح 13 بالمائة فقط من المشكلات في امتحان تأهيلي لأولمبياد الرياضيات الدولي مقارنة بـ o1، الذي حل 83 بالمائة.

ومع ذلك، لا يتضمن النموذج الجديد قدرات مثل تصفح الويب أو القدرة على تحميل الملفات والصور. ووفقًا لـ The Verge، فهو أبطأ بشكل ملحوظ في معالجة المطالبات مقارنة بـ GPT-4o. على الرغم من امتلاكها وقتًا أطول للنظر في مخرجاتها، إلا أن o1 لم تحل مشكلة “الهلوسة” – وهو مصطلح لنماذج الذكاء الاصطناعي التي تصنع المعلومات. قال كبير مسؤولي الأبحاث في الشركة بوب ماكجرو لموقع The Verge: “لا يمكننا القول أننا حللنا الهلوسة”.

لا تزال O1 في مرحلة ناشئة. تطلق عليها OpenAI اسم “معاينة” وتجعلها متاحة فقط لعملاء ChatGPT المدفوعين بدءًا من اليوم مع قيود على عدد الأسئلة التي يمكنهم طرحها أسبوعيًا. بالإضافة إلى ذلك، تطلق OpenAI أيضًا o1-mini، وهي نسخة مخففة تقول الشركة إنها فعالة بشكل خاص للترميز.