7月18日、米国を拠点とする人工知能(AI)企業である。OpenAIはブログで次のように発表した。 GPT-4oミニと呼ばれる新しい、費用対効果の高い生成AIモデルを発表した;
この縮小版は、より多くの企業やプログラムが高度なAI機能を活用できるように設計されている。
GPT-4oミニのご紹介
GPT-4oミニモデルのナレッジは昨年10月に更新され、言語タイプはGPT-4oと同じになり、128kトークンのコンテキストウィンドウを備えている。
この新モデルは、前モデルと同じ機能の多くをサポートしており、現在はAPIを通じてテキストとビジュアルモダリティを提供しているが、将来的にはビデオとオーディオの入出力に拡張する予定である。
正確なパラメータは公表されていない、OpenAIの公式ブログ記事 と述べている:
「現時点では、最も経済的で費用対効果の高い小型モデルであり、間もなく微調整が可能になる。
驚くべきことに、GPT-4o miniはLMSYSランキングのチャット優先度でGPT-4を上回り、総合ランキングではGPT-4 Turboに匹敵する。
リリース前、6,000人以上のユーザーが初期バージョンである "upcoming-gpt-mini,"に投票したが、結果はその後削除された。
LMSYSは、Xで再び投票を募り、近日中に正式モデルの結果を発表すると発表した。
GPT-4o miniのリリースは、AIの応用範囲を大きく広げることになるだろう。
低コストで低レイテンシーなだけでなく、複数のモデルを連鎖させたり並列化したり(複数のAPIを呼び出す)、広範なコンテキストをモデルに渡したり(完全なコードベースや会話履歴など)、迅速なリアルタイムのテキスト応答を通じて顧客と対話したり(チャットボットをサポート)するアプリケーションなど、さまざまなタスクをサポートしている。
さらに、GPT-4oと共有されている改良されたトークナイザーのおかげで、非英語テキストをよりコスト効率よく処理することができます。
テキストインテリジェンスとマルチモーダル推論の点で、GPT-4o miniはGPT-3.5 Turboや他の小型モデルを凌駕し、GPT-4oがサポートするすべての言語をサポートします。
また、GPT-3.5ターボと比較して、ロングコンテキストの処理性能が向上しており、関数呼び出しでの性能も高いため、開発者のアプリケーション構築の利便性が向上している。
ミニモデルが他のモデルと比べて環境面でメリットがあるかどうかはまだ不明だ。
OpenAIは、ランニングコストを削減するために使用された方法に関する情報を提供していないため、その恩恵は実際のエネルギー節約には及ばず、代わりにエンドユーザーのコスト節約に適用される可能性があることを示唆している。
OpenAIによれば、電力と性能のトレードオフは最小限だという。
エネルギー消費量は少ないが、GPTミニの性能に不足はないようだ。
OpenAI'のブログポストでは、新しいモデルは以前のフロンティアモデルより1桁手頃で、GPT-3.5ターボより60%以上安いと書かれている;
同社はこう書いている:
"GPT-4oミニは、GPT-3.5ターボや他の小型モデルを、テキスト知能とマルチモーダル推論の両方で学術的ベンチマークで上回り、GPT-4oと同じ範囲の言語をサポートしています。"
GPT-4oミニの価格は、1Mトークン入力あたり15セント、1Mトークン出力あたり60セント。
1Mのトークンは2,500ページの本に相当する。
このモデルは、ラマ3 8Bに次ぐ低価格で高性能なモデルとして位置づけられている。
下の表にあるように、現在主要メーカーがリリースしている小型モデルの中で、GPT-4o miniはジェミニ1.5フラッシュ、ラマ3 8B、ミストラル7Bなど多くの競合モデルを凌駕しており、最もコストパフォーマンスの高い選択肢となっている。
新モデルを担当するオープンエイのプロダクトマネージャー、ゴドメントはこう語る:
「OpenAIの要点は、AIを安全に構築・配布し、広く利用できるようにすることです。より低いコストでインテリジェンスを利用できるようにすることは、私たちにとって最も効率的な方法の一つです"
Godement氏は、OpenAIはモデルアーキテクチャを改善し、トレーニングデータとレジメンを改良することで、より安価な製品を開発したと説明した。
彼は、GPT-4o miniは、いくつかの一般的なベンチマークにおいて、市場にある他の小型モデルを凌駕していると述べた。
同氏は、GPT-4o miniがAIをより広く利用できるようにするというOpenAIの使命を体現していることを改めて強調した。AIが世界の隅々、あらゆる産業、あらゆるアプリケーションに利益をもたらすためには、より手頃な価格で提供されなければなりません。
彼は繰り返した:
「GPT-4o miniは、OpenAIのミッションである、AIをより広く人々が利用できるようにすることを真に実現していると思います。AIが世界の隅々、あらゆる産業、あらゆるアプリケーションに恩恵をもたらすことを望むなら、AIをより安価にしなければならない。"
彼は、顧客のニーズが進化していることを認めている:
「私たちが市場でますます目にするようになったのは、開発者や企業が小規模モデルと大規模モデルを組み合わせて、自分たちにとって納得のいく価格とレイテンシーで最高の製品体験を構築することです」。
Godement氏によれば、OpenAIのクラウドサービスは、競合他社よりも多くのセキュリティテストを経たモデルを顧客に提供する。彼は、OpenAIは最終的には顧客が自分のデバイス上で実行できるモデルを開発することができると付け加えた。
彼はこう締めくくった:
「莫大な需要が見込めれば、そのドアを開けるかもしれない」。
GPT-4oミニはアップルのiPhoneSE?
GPT-4o miniは、OpenAIの主力製品であるChatGPTのコストパフォーマンスに優れた製品です。
iPhone3Gから最新のiPhone15 Pro Maxに至るまで、アップル社がiPhoneを頻繁にリリースしているのと並行して、OpenAIはChatGPTで同様の戦略を採用しているようだ。
OpenAIのアプローチは、iPhoneのインクリメンタルアップデートに対する批判と同じように、最小限のアップグレード、あるいはそれ以下のアップグレードを提供する一方で、大幅な値上げにつながるのだろうか?
競争が激化する中、着実に新機能を導入するOpenAI
GPT-4oミニの発売は、OpenAIの慌ただしい動きと、同社に向けられた様々な行動と重なる。
オープンAIは、GPT-4oを超える高度な推論能力を発揮し、より人間に近い反応を示すと期待されるAIモデル「ストロベリー」を開発中だと報じられている。
この新モデルは、同社の謎めいたQ*プロジェクトの延長線上にあると噂されている。
これとは別に、オープンAIは、秘密保持契約の使用に関する不正行為の可能性について調査を求める内部告発を受け、米国証券取引委員会(SEC)の監視下に置かれる可能性がある。
OpenAIはこれを、AIを可能な限り広く利用できるようにするための努力の一環と位置づけているが、AIクラウドプロバイダー間の競争の激化や、小規模で無料のオープンソースAIモデルへの関心の高まりも強調している。
複数の情報筋によると、メタ社は7月23日に、4000億のパラメータを誇るラマ3の最大バージョンを発表する予定だが、リリース日は変更される可能性があるとのことだ。
このバージョンのLlama 3の機能はまだ不明だが、費用対効果、カスタマイズ性、モデルと処理するデータの両方をよりコントロールしやすいという理由から、オープンソースのAIモデルに惹かれている企業もある。