OpenAI'のOperatorでAIが実世界のタスクを処理する
航空券の予約から食料品の注文まで、オンラインでの用事をAIに依頼し、AIがこれらのタスクを正確にこなす様子を想像してみてほしい。
OpenAIの新機能「Operator」は、まさにこれを約束するものだ。
仮想ブラウザーをコントロールすることで、オペレーターはリアルタイムのアクションを通じてデジタル雑用を簡素化することを目指している。
しかし、その高額な価格と独占性は、アクセシビリティと公平性に関する議論を巻き起こしている。
今朝発表されたこの新機能は、米国内のプロ契約者だけが利用でき、料金は月額200ドル。
この発表は、OpenAIが自律的なウェブ閲覧への第一歩を踏み出したことを意味し、ユーザーに日々のオンライン活動を管理する革新的な方法を提供する。
オペレーターの舞台裏
APIに依存する以前のツールとは異なり、Operatorは人間の行動を模倣するクラウドベースのブラウザを採用している。
ボタンをクリックしたり、フォームに入力したり、ウェブサイトのレイアウトを解釈したりして、ウェブサイトをナビゲートする。
各アクションはスクリーンショットで記録され、ユーザーに進捗状況を知らせる。
たとえば、イベントのチケットを予約する場合、「オペレーター」はオプションを検索し、最もお得なプランを選択し、支払いを確定する前にユーザーの確認を要求します。
問題が発生した場合、ユーザーは "Take Control "オプションを使って手動で介入することができる。
Operatorの機能の中心にあるのは、新しいAIモデル、コンピュータ・ユーザー・エージェント(CUA)です。
このモデルにより、システムは予期せぬウェブサイトの変更、ポップアップ、エラーメッセージを最小限の混乱で処理することができる。
この適応性は、Operatorを際立たせ、サポートされていないプラットフォームでも機能させることができます。
ビジュアル・フィードバックによる実世界での機能
オペレーターは、GPT-Visionを使用して手書きの買い物リストを解釈し、希望する店舗に食料品を注文するなど、多様なタスクに取り組むことができる。
UberやDoorDashのようなプラットフォームとの事前設定されたパートナーシップは、乗り物の予約や食品の配達のための円滑なナビゲーションを保証する。
明示的にサポートされていないWebサイトについては、Operatorはブラウザ制御機能を介してタスクの実行を試みます。
この柔軟性が競合他社を凌駕し、日常的なオンライン業務のための多用途ソリューションとなっている。
ライバルを凌駕する印象的なベンチマーク
テストでは、Operatorは同様のツールと比較して優れた性能を実証した。
標準的なOSを扱うためのベンチマークであるOSWorldでは38.1%の習熟度を達成し、最も近い競合他社の22%を上回った。
eコマースのナビゲーションを評価するWebArenaでは、オペレーターは58.1%を獲得し、競合他社の36.2%を上回った。
OpenAIは、実世界のアプリケーションにおけるOperatorの有効性と信頼性を示すために、これらの結果を強調しました。
ただし、この機能はまだ研究プレビューの段階であり、時折エラーやバグが発生することが予想されるとしている。
今のところ独占的で高価
現在、OperatorはProユーザーに限定されており、経済的な障壁となっている。
この排他性により、裕福なユーザーだけが最高のAI能力を利用できる階層システムの出現が懸念されている。
OpenAIは、近々Plus加入者への展開を拡大する予定で、さらにAPIを通じて利用できるようになり、開発者向けの新しい自動化ツールを生み出す可能性がある。
プライバシーへの懸念と信頼の問題
特筆すべき欠点は、タスクを完了するためにユーザー認証情報に依存していることだ。
クラウド・ブラウザで動作するため、ユーザーはリモートでログインする必要があり、機密データが保存されないというOpenAIの保証に大きな信頼を置いている。
プライバシーを重視する個人にとって、このOpenAIのサーバーへの依存は契約違反になりかねない。
オペレーターのリスク対応
OpenAIのオペレーターアップグレードは200ドルの値札に値するか?
OpenAIは、新しいウェブブラウジングコントロールだけでなく、現在のアシスタントの機能をさらに強化するためにAIエージェントを拡張している。
これらの追加エージェントはオペレーターを補完するように設定されているが、具体的な機能はまだ明らかにされていない。
今のところ、OperatorはAIによる自動化を大きく前進させ、航空券の予約や食事の注文といった日常業務を効率化する。
しかし、この新しいアップグレードは本当に200ドルという高額な月額料金を払う価値があるのだろうか?
Operatorは利便性を提供する一方で、これらのタスクを手作業で管理する経験を奪ってしまう。
人間の監督に頼るということは、完全に自律的なソリューションを求める人々にとって、このシステムを魅力的なものにはしないかもしれない。
OpenAIが提供するサービスを拡大するための新たな方法を模索し続けている中、このアップデートの価値については議論の余地がある。