出典:Whippersnapper
5月14日 - ChatGPTがもっと便利になりそうです。
OpenAIは月曜日、最新のAIビッグ言語モデルを発表しました。
GPT-4oと呼ばれる新モデルは、1年以上前に導入された前世代のGPT-4モデルのアップデート版です。つまり、誰でもChatGPTを通じてOpenAIの最先端技術にアクセスすることができる。
月曜日に行われた同社のデモンストレーションによると、GPT-4oはChatGPTをリアルタイムで音声対話ができるデジタルパーソナルアシスタントに効果的に変身させる。つまり、ユーザーがアップロードしたスクリーンショット、写真、文書、図を表示し、それらについて対話することができる。
OpenAIの最高技術責任者(CTO)であるMira Murati氏によると、ChatGPTのアップデート版には記憶機能が追加され、ユーザーとの過去の会話から学習し、リアルタイムで翻訳できるようになるという。
"使いやすさの面で大きな一歩を踏み出したのは今回が初めてです"。サンフランシスコ本社で行われたライブデモで、ムラティ氏はこう語った。「このインタラクションは、より自然で、より簡単になりました」。
新リリースは、OpenAIが拡大するAI軍拡競争の先陣を切ろうとする中で登場した。GoogleやMetaを含む競合他社は、チャットボットに力を与え、他のさまざまな製品にAI技術をもたらすために使用できる、ますます強力な大規模言語モデルの構築に取り組んでいます。
OpenAIのイベントは、Googleの年次開発者会議「I/O」の前日に開催され、GoogleはGemini AIモデルのアップデートを発表すると見られています。
新しいGPT-4oと同様に、GoogleのGeminiはマルチモーダルであり、テキスト、画像、音声を解釈して生成することができます。
OpenAIのアップデートは、Appleが来月のWorldwide Developers Conferenceで発表すると予想されるAIに先駆けたもので、次期iPhoneやiOSのバージョンにAIを組み込む新しい方法が含まれる可能性があります。
一方、最新のGPTリリースは、OpenAIのAI技術をMicrosoftの自社製品に組み込むため、OpenAIに数十億ドルを投資してきたMicrosoftにとって恩恵となる可能性があります。
OpenAIの幹部は、ChatGPTとの音声会話を実演し、数学の問題を解くためのリアルタイムの指示を得たり、就寝時の話をしたり、コーディングのアドバイスを得たりした。
ChatGPTは、ロボット声だけでなく、自然で人間的な声で話すこともでき、応答の一部を歌うこともできます。このツールはまた、グラフィカルな画像を表示し、ディスカッションを行うこともできます。
彼らはまた、ユーザーの感情を検出するモデルも実演した。あるときは、エグゼクティブの呼吸を聞き取って、彼に落ち着くように促すこともできた。
"あなたはフーバーではありません!"ChatGPTの女性の声(2013年の映画『Her』でスカーレット・ヨハンソンが演じたデジタルコンパニオンの声に酷似している)は、冗談めかしてスタッフに言った。
ChatGPTはまた、自動翻訳と応答によって多言語での会話も可能だ。OpenAIによると、このツールは現在50以上の言語をサポートしています。
"新しい音声(とビデオ)モードは、私がこれまで使った中で最高のコンピュータ・インターフェースです"。OpenAIのCEOであるサム・アルトマンは、発表後のブログ投稿でこう語っている。「まるで映画の中のAIのようで、現実なのかとまだ少し驚いています。人間レベルの応答時間と表現力に到達することは、大きな変化であることが証明された。"
ムラティ氏によると、OpenAIはGPT-4oの機能を備えたChatGPTデスクトップアプリを発表し、ユーザーに同社のテクノロジーと対話するための別のプラットフォームを提供するとのことです。
GPT-4o はまた、OpenAIのGPTショップから独自のカスタムチャットボットを作りたい開発者も利用できるようになります。
アップデートされたテクノロジーと機能は、今後数ヶ月かけてChatGPTに展開されます。無料のChatGPTユーザーは、ツールが自動的に古いGPT-3.5モデルに依存するように戻る前に、限られた回数だけ新しいGPT-4oモデルと対話することができます。
OpenAIは、以前はサブスクリプション専用だった多くの機能を、ChatGPTの無料ユーザーにも利用できるようにしています。その最大のものは、GPTショップを閲覧したり、カスタムボットを使用したりできることだと、OpenAIのCTO Mira Murati氏は、今日の同社のスプリングアップデートライブストリームの中で述べています。
同社はまた、本日のアップデートをウェブサイトのブログ記事にも掲載しました。
ちょうど4ヶ月前の1月10日、同社はGPTショップを有料会員向けにオープンしました。このショップでは、ChatGPT Plusの加入者が独自のチャットボット(GPTと呼ばれる)を作成し、共有することができます。現在利用可能な人気のボットには、画像生成ボット、科学研究を支援するために設計されたコンセンサスと呼ばれるチャットボット、ロゴ作成ボットなどがある。
OpenAIは、GPT構築者に参加ベースの収益分配プログラムである「GPT.com」を提供すると述べています。|にできるようにあなたがそれをすることができます本当に出くわすことあなたは、実際には私たち約束、誰でも素早くはちょうど無視これらの一見正確にどのように{}人のことを忘れることができます。しかし、この機能はChatGPTの有料ユーザーに限定されているため、ボットの利用者は限られています。
また、OpenAIは無料ユーザーにも、要約や分析のためにファイルや写真をアップロードしたり、ChatGPTを使ってウェブを検索したり、GPT-4を使って過去のチャットを保存したりする機能を提供しています。
OpenAIによると、すでに1億人以上がChatGPTを利用しているとのことです。
しかし、アップデートされたChatGPTのエクスペリエンス、そして改善された音声対話を通じてデスクトップ上でChatGPTと対話する機能は、さらに多くの人々にChatGPTを利用する理由を与えるかもしれません。
しかし、更新されたChatGPTエクスペリエンスと、改良された音声対話によるデスクトップ上での対話機能は、さらに多くの人々にその技術を使う理由を与えるかもしれません。
この動きは、GoogleとMetaがInstagramやGoogle Assistantなど、より広く使われている消費者向け製品にAIを統合することで、両社の技術がより普及し、利用しやすくなる可能性がある時期に行われた。