OpenAI gần đây đã ra mắt mẫu GPT-4o mini mới, thay thế cho GPT-3.5 ban đầu.
Mô hình này nhanh hơn, rẻ hơn và thông minh hơn và thậm chí có thể được sử dụng bởi người dùng phiên bản miễn phí.
OpenAI cho biết GPT-4o mini vượt trội hơn GPT-3.5 Turbo trong nhiều tác vụ, bao gồm xử lý văn bản, lý luận đa phương thức và khả năng lập trình toán học.
Ưu điểm chính
Trong bảng xếp hạng LMSYS, GPT-4o mini hoạt động tốt ở hiệu suất đọc, có cửa sổ ngữ cảnh 128.000 mã thông báo và hỗ trợ tới 16.000 mã thông báo đầu ra cho mỗi yêu cầu. GPT-4o mini hoạt động tốt trong nhiều bài kiểm tra điểm chuẩn:
- Hiệu suất tác vụ lý luận: Trong các tác vụ lý luận liên quan đến văn bản và hình ảnh, GPT-4o mini đạt 82,0% trên MMLU (Hiểu ngôn ngữ đa tác vụ quy mô lớn), vượt trội so với Gemini Flash và Claude Haiku.
- Khả năng toán học và lập trình: GPT-4o mini đạt 87,0% trong MGSM (bài kiểm tra lý luận toán học) và 87,2% trong HumanEval (bài kiểm tra lập trình), cả hai đều vượt trội so với các mô hình cạnh tranh.
- Lý luận đa phương thức: Trên MMMU (Đánh giá lý luận đa phương thức), GPT-4o mini đạt 59,4%, dẫn đầu các mẫu khác.
Giá cả và tính sẵn có
GPT-4o mini có giá rất cạnh tranh chỉ 15 xu trên một triệu mã thông báo đầu vào và 60 xu trên một triệu mã thông báo đầu ra, rẻ hơn 60% so với GPT-3.5 Turbo. Mô hình này đã có sẵn trong API Trợ lý, API Hoàn thành trò chuyện và API hàng loạt và có sẵn cho người dùng ChatGPT miễn phí, Plus và Nhóm, với người dùng doanh nghiệp sẽ có quyền truy cập vào tuần tới.
sự an toàn
OpenAI nhấn mạnh tính bảo mật của GPT-4o mini, vượt qua công nghệ lọc nghiêm ngặt và học tăng cường phản hồi của con người (RLHF) từ trước đào tạo đến sau đào tạo. Mô hình này áp dụng "phương pháp cấp độ hướng dẫn" trong API lần đầu tiên, giúp cải thiện hiệu quả khả năng của mô hình trong việc chống lại việc bẻ khóa bất hợp pháp, chèn nhanh và trích xuất nhanh chóng của hệ thống, đảm bảo độ tin cậy của các câu trả lời.
Kịch bản ứng dụng
GPT-4o mini hỗ trợ nhiều tác vụ với chi phí thấp và độ trễ thấp, chẳng hạn như:
- Song song hóa nhiều cuộc gọi mô hình
- Cung cấp nhiều thông tin theo ngữ cảnh
- Phản hồi văn bản nhanh chóng, tức thì để tương tác với khách hàng