نموذج O1 الجديد من OpenAI أبطأ عن قصد

منى غالي

منذ 2 شهور

أعلنت شركة OpenAI عن أحدث نموذج للذكاء الاصطناعي يسمى O1، والذي تقول الشركة إنه قادر على أداء مهام التفكير المعقدة بشكل أكثر فعالية من سابقاتها. يأتي الإصدار في الوقت الذي تواجه فيه OpenAI منافسة متزايدة في السباق لتطوير أنظمة ذكاء اصطناعي أكثر تقدمًا.

وقالت OpenAI على موقعها على الإنترنت إن O1 تم تدريبه على “قضاء المزيد من الوقت في التفكير في المشكلات قبل التصرف عليها، تمامًا كما يفعل الإنسان”. “من خلال التدريب، تتعلم [النماذج] كيفية تحسين عملية التفكير لديهم، وتجربة استراتيجيات مختلفة، والتعرف على أخطائهم.” وتتوقع شركة OpenAI أن يتم استخدام النموذج الجديد من قبل الباحثين في مجال الصحة لشرح بيانات تسلسل الخلايا، ومن قبل الفيزيائيين لإنشاء صيغ رياضية. مطوري البرمجيات.

أنظمة الذكاء الاصطناعي الحالية هي في الأساس إصدارات أكثر تطوراً من الإكمال التلقائي، حيث تولد الإجابات بناءً على الإحصائيات بدلاً من “التفكير” فعليًا في سؤال ما، مما يعني أنها أقل “ذكاءً” مما تبدو عليه. على سبيل المثال، عندما حاولت شركة Engadget جعل ChatGPT وغيره من برامج الدردشة الآلية التي تعمل بالذكاء الاصطناعي لحل لغز New York Times Spelling Bee، فشلت وأعادت نتائج غير منطقية.

مع o1، تدعي الشركة أنها “تعيد العداد إلى 1” باستخدام نموذج ذكاء اصطناعي جديد مصمم لحل المشكلات المعقدة واستخدام التفكير المنطقي. وفي منشور مدونة يشرح النموذج الجديد، قال OpenAI إنه يؤدي أداءً مشابهًا لطلاب الدراسات العليا في المهام القياسية الصعبة في الفيزياء والكيمياء والأحياء، ويتفوق في الرياضيات والبرمجة. على سبيل المثال، نجح نموذجها الرئيسي الحالي، GPT-4o، في حل 13% فقط من المسائل بشكل صحيح في الاختبار التأهيلي لأولمبياد الرياضيات الدولي، مقارنة بـ o1، الذي حل 83%.

ومع ذلك، فإن النموذج الجديد لا يتضمن ميزات مثل تصفح الويب أو القدرة على تحميل الملفات والصور. وفقًا لموقع The Verge، فإن معالجة المطالبات أبطأ بكثير مقارنةً بـ GPT-4o. وعلى الرغم من أن o1 كان لديه المزيد من الوقت للنظر في نتائجه، إلا أنه لم يتمكن من حل مشكلة “الهلوسة” – وهو مصطلح يشير إلى نماذج الذكاء الاصطناعي التي تشكل المعلومات. وقال بوب ماكجرو، كبير مسؤولي الأبحاث في الشركة، لموقع The Verge: “لا يمكننا أن نقول إننا قمنا بحل الهلوسة”.

O1 لا يزال في مراحله المبكرة. يطلق عليها OpenAI اسم “المعاينة” ويجعلها متاحة فقط لعملاء ChatGPT المدفوعين بدءًا من اليوم، مع حد لعدد الأسئلة التي يمكنهم طرحها أسبوعيًا. بالإضافة إلى ذلك، تطلق OpenAI أيضًا o1-mini، وهي نسخة مبسطة تقول الشركة إنها فعالة بشكل خاص في البرمجة.