OpenAI công bố ‘Project Strawberry’ là o1, nâng cao khả năng suy luận
OpenAI đã chính thức ra mắt o1, mô hình được mong đợi từ lâutrước đây được gọi là “Dự án Strawberry”.
Mô hình AI mới này nhằm mục đích nâng cao khả năng lý luận và giải quyết vấn đề, đánh dấu bước tiến đáng kể trong quá trình phát triển AI. o1, bao gồm các phiên bản đầu tiên — o1-preview và o1-mini — hiện đang có sẵn trong giai đoạn xem trước dành cho người đăng ký ChatGPT Plus và Teams.
Phiên bản o1-preview cho phép người dùng gửi tối đa 30 tin nhắn, trong khi phiên bản o1-mini chỉ giới hạn 50 tin nhắn.
OpenAI giải thích:
“Chúng tôi đã đào tạo các mô hình này để dành nhiều thời gian hơn để suy nghĩ thấu đáo về các vấn đề trước khi phản hồi, giống như cách con người vẫn làm.”
Cách tiếp cận này liên quan đến việc mô hình phải tinh chỉnh quá trình suy nghĩ, thử nhiều chiến lược khác nhau và nhận ra những sai lầm của mình.
Sự tiến bộ này đặc biệt quan trọng vì các mô hình AI truyền thống thường gặp phải "ảo giác", khi chúng tạo ra kết quả không chính xác hoặc vô nghĩa do thiếu lý luận thực sự.
Bằng cách nâng cao khả năng cân nhắc và phân tích của mô hình, OpenAI hướng đến mục tiêu đưa ra những phản hồi chính xác và đáng tin cậy hơn.
Kỹ thuật đào tạo nâng cao của O1
Mô hình o1 mới của OpenAI được xây dựng trên phương pháp đào tạo khác biệt cơ bản so với các mô hình tiền nhiệm.
Bob McGrew, giám đốc nghiên cứu của OpenAI đã chia sẻ:
“Chúng tôi đã dành nhiều tháng để nghiên cứu lý luận vì chúng tôi nghĩ đây thực sự là bước đột phá quan trọng.”
Không giống như các mô hình trước đây tập trung vào việc dự đoán từ hoặc câu tiếp theo dựa trên các mẫu, o1 sử dụng thuật toán tối ưu hóa mới và bộ dữ liệu đào tạo được thiết kế riêng.
Mô hình này áp dụng phương pháp học tăng cường, trong đó máy học thông qua phần thưởng và hình phạt, cho phép máy giải quyết vấn đề theo từng bước tương tự như quá trình suy nghĩ của con người.
Kết quả là một mô hình có thể xử lý các tác vụ phức tạp với hiệu quả cao hơn.
Ví dụ, trong một cuộc trình diễn, mô hình mới có thể giải quyết các câu đố phức tạp và các bài toán với độ chính xác đáng chú ý.
Trong một bài kiểm tra, o1 đã đạt được số điểm ấn tượng là 83 phần trăm trong kỳ thi tuyển sinh Olympic Toán học quốc tế, cải thiện đáng kể so với 13 phần trăm của GPT-4o.
Trong các cuộc thi lập trình trực tuyến, o1 đã đạt đến mức phần trăm thứ 89, thể hiện khả năng giải quyết vấn đề tiên tiến của mình.
Giải quyết vấn đề và lý luận nâng cao
Mô hình o1 của OpenAI thể hiện sự tiến bộ đáng kể trong việc xử lý các truy vấn phức tạp.
Nó vượt trội trong các lĩnh vực như mã hóa và suy luận toán học, hoạt động tốt hơn các mô hình trước đây trong việc tạo và gỡ lỗi mã phức tạp cũng như giải các công thức toán học phức tạp.
Jakub Pachocki, nhà khoa học trưởng của OpenAI, lưu ý rằng mô hình mới có thể cần thời gian để giải quyết vấn đề, khác hẳn với phản ứng nhanh chóng theo khuôn mẫu của các phiên bản trước.
Ông phát biểu:
“Mô hình này có thể mất thời gian. Nó có thể suy nghĩ thấu đáo vấn đề — bằng tiếng Anh — và cố gắng phân tích nó và tìm kiếm các góc độ để đưa ra câu trả lời tốt nhất.”
Tuy nhiên, khả năng tiên tiến này đi kèm với chi phí cao hơn.
Đối với các nhà phát triển sử dụng API, giá cả cao hơn đáng kể: o1-preview có giá 15 đô la cho 1 triệu mã thông báo đầu vào và 60 đô la cho 1 triệu mã thông báo đầu ra, so với giá lần lượt là 5 đô la và 15 đô la của GPT-4o.
Mặc dù có nhiều ưu điểm, o1 vẫn có những hạn chế, chẳng hạn như không hiệu quả trong việc cung cấp kiến thức thực tế và thiếu các chức năng như duyệt web hoặc xử lý hình ảnh.
Xử lý giống con người và hướng đi trong tương lai
Việc giới thiệu o1 cũng bao gồm các tính năng cải tiến được thiết kế để mô phỏng khả năng suy luận giống con người.
Trong quá trình trình diễn, mô hình đã thể hiện những cụm từ như "Tôi tò mò về", "Tôi đang suy nghĩ" và "Được rồi, để tôi xem", tạo ra ảo giác về quá trình suy nghĩ có chủ đích.
Mặc dù mô hình không thực sự có tri giác, nhưng những tính năng này sẽ nâng cao trải nghiệm của người dùng bằng cách làm cho các bước lý luận trở nên minh bạch hơn.
Kế hoạch tương lai của OpenAI bao gồm việc mở rộng hơn nữa khả năng của o1.
Công ty đặt mục tiêu giới thiệu các tính năng như duyệt, tải tệp và hình ảnh để tăng tiện ích của mô hình.
Khi OpenAI tiếp tụctìm kiếm nguồn tài trợ và đặt mục tiêu định giá 150 tỷ đô la những tiến bộ như o1 đóng vai trò quan trọng trong nỗ lực lớn hơn nhằm phát triển các hệ thống tự động và đạt được trí thông minh giống con người.