أعلنت شركة OpenAI عن إطلاق o1، وهو نموذج ذكاء اصطناعي يتمتع بقدرات استدلالية، يحمل الاسم الرمزي داخليًا "الفراولة". يمكن لـ OpenAI o1 التفكير في المهام المعقدة وحل المشكلات الأصعب من النماذج العلمية والبرمجية والرياضية السابقة.
في الاختبارات، كان أداء OpenAI o1 مثل طالب دكتوراه في المهام المعيارية الصعبة في الفيزياء والكيمياء وعلم الأحياء، وتفوق في الرياضيات والبرمجة. في الاختبار التأهيلي لأولمبياد الرياضيات الدولي (IMO)، نجح GPT-4o في حل 13% فقط من المشكلات بشكل صحيح، بينما سجل نموذج الاستدلال 83%، ووصلت قدرة OpenAI o1 على البرمجة إلى النسبة المئوية 89 في مسابقة Codeforces.
في حين أن OpenAI o1، وهو نموذج مبكر، لا يحتوي حتى الآن على العديد من ميزات ChatGPT المفيدة، مثل تصفح الويب للحصول على معلومات وتحميل الملفات والصور، فإن GPT-4o سيكون أكثر قوة على المدى القصير. ولكن بالنسبة لمهام التفكير المعقدة، يعد هذا تقدمًا كبيرًا ويمثل مستوى جديدًا من قدرات الذكاء الاصطناعي.
لهذا السبب تتم إعادة ضبط العداد على 1 وتسمى السلسلة OpenAI o1. يمكن للباحثين في مجال الرعاية الصحية استخدام o1 لتعليق بيانات تسلسل الخلايا، ويمكن للفيزيائيين استخدام o1 لإنشاء الصيغ الرياضية المعقدة المطلوبة للبصريات الكمومية، ويمكن للمطورين في جميع المجالات استخدام o1 لبناء وتنفيذ سير عمل متعدد الخطوات.
أصدرت OpenAI أيضًا OpenAI o1-mini، وهو نموذج استدلالي فعال من حيث التكلفة. تتفوق o1-mini في العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، وخاصة الرياضيات والبرمجة - حيث تقدم أداءً مماثلًا تقريبًا لـ OpenAI o1 في معايير التقييم مثل AIME وCodeforces. تتوقع OpenAI أن يكون o1-mini نموذجًا أسرع وفعالاً من حيث التكلفة وأرخص بنسبة 80% من o1-preview للتطبيقات التي تتطلب الاستدلال دون معرفة عالمية واسعة النطاق. يمكن لمستخدمي ChatGPT Plus وTeam وEnterprise وEdu استخدام o1-mini كبديل لمعاينة o1 مع حدود معدل أعلى وزمن وصول أقل.