ログイン/ 登録

ChatGPTが進化：OpenAIのAIチャットボット、見て、聞いて、話せるようになる

2023/09/26 14:15

従う

OpenAIのChatGPT は、ユーザーとのインタラクションを再定義する、革新的な新機能の数々を導入しようとしている。

において9月25日に公式ブログで発表された。 OpenAIは、画像と音声認識というダイナミックな媒体を通じて、ユーザーがChatGPTと関わることを可能にする、今後の機能拡張を明らかにした。

音声生成と画像理解という基礎研究は、将来、より高度なAIがどのような能力を発揮するかを垣間見せてくれる。このアップデートの詳細と安全対策については、こちらをご覧ください：https://t.co/uNZjgbR5Bm
- オープンAI（@OpenAI）2023年9月25日

今回のアップグレードの目玉のひとつは、ユーザーが音声コマンドを使ってChatGPTと対話できる機能で、よりパーソナライズされた没入感のあるユーザー体験を約束する。

この機能は、プロの声優が作成した最小限のサンプル音声に基づいて音声を生成することに長けた音声合成モデルからその力を引き出している。

Whisperとして知られるオープンソースの音声認識システムが、この革新的な音声インターフェースに不可欠な役割を果たしていることは注目に値する。

これらの音声機能の潜在的な用途は、興味深いと同時に多様である。

あなたの声でChatGPTと一対一の会話ができます。外出先で会話したり、就寝前の読み聞かせをリクエストしたり、食卓での議論に決着をつけたり。

サウンド・オン・ザ・ᔊ」。pic.twitter.com/3tuWzX0wtS
- オープンAI（@OpenAI）2023年9月25日

就寝前の読み聞かせやレシピ作りから、スピーチの作成、詩の朗読、常套句の解明、さらには食卓での議論の仲裁に至るまで、ユーザーはより幅広い使用例を想定することができる；

OpenAI'のビジョンは明確で、個人が日常生活でテクノロジーと接する方法を強化し、豊かにすることである。

さらにOpenAIは、ChatGPTに画像を送信して解釈と応答を求めたり、画像内の特定の要素を選択的にハイライトして詳細な調査を行ったりする機能をユーザーに提供する準備を進めている。

同社によれば

「音声と画像で、ChatGPTの使い方が広がります。旅行中にランドマークをスナップして、何が面白いかをライブで会話しましょう；

これらの追加は、OpenAIがGPT VisionまたはGPT-Vと呼ぶ範囲に位置づけられ、理論的なGPT-5とは異なるが、それでも実質的な前進である。

これらの要素は、"侍ジャパン "の根幹をなすものである。GPT-4の拡張マルチモーダル版今年初めにOpenAIが予告していた技術の進化と一致している。

この大幅なアップグレードは、OpenAIが発表したDALL-E 3に続くものである。DALL-E 3は、その卓越した品質と精度で初期のテスターから賞賛を集めたテキスト画像ジェネレーターである。

DALL-E 3は、GPT-4に支えられたサブスクリプション・サービス、ChatGPT Plusの中にその居場所を見つけた。

DALL-E 3と会話型ボイスチャットの融合は、OpenAI'が、人間の認知に近い世界を認識する能力を持つAIアシスタントを進化させ、ユーザー体験を向上させるために複数の感覚を活用することへの確固としたコミットメントを示すものです。

視覚と音声生成を含むマルチモーダルAIシステムにリスクはあるか？

しかし、OpenAIは、視覚と音声生成の両方を含むマルチモーダルAIシステムの能力を強化することに内在する潜在的な危険性について、警戒する姿勢を維持している。

適切な懸念は、なりすましの危険性、潜むバイアスの恐怖、視覚的解釈への複雑な依存を中心に展開される。

同社は発表の中で次のように述べている：

「OpenAIの目標は、安全で有益なAGIを構築することです。私たちは、ツールを徐々に利用できるようにすることを信じています。そうすることで、時間をかけて改良を加え、リスクを軽減することができます；

戦略的な動きとして、OpenAIはこれらの革新的な機能の展開計画を明確にした。

当面、PlusとEnterpriseのユーザーには、今後2週間以内にこれらの機能へのアクセスが許可される。

さらにOpenAIは、このアクセスをより広範な開発者コミュニティに拡大する意向を持っている。

ChatGPT

OpenAI

有益なレポートを通じて仮想通貨業界の幅広い理解を得て、志を同じくする他の著者や読者との詳細な議論に参加してください。拡大している Coinlive コミュニティにぜひご参加ください。https://t.me/CoinliveSG

コメントを追加する

ログインあなたの素晴らしいコメントを残すために…

0 コメント

最も早い

コメントをさらに読み込む

に関するその他のニュース open ai new chat

10月 25
Meta Partners With Reuters To Integrate AI Chat Functions
強気
弱気
5月 15
Google's new Gemini AI tool wants you to chat for your photos
強気
弱気
2月 06
Roblox、リアルタイムAIチャット翻訳機能を開始
強気
弱気
2月 06
Real-time AI Chat Translation Comes to Roblox
強気
弱気
12月 09
注目のAIジェミニがチャットに登場
強気
弱気
9月 07
FaTPay出資のAIプロジェクトreAI.chatが新ツールPrompterを発表
強気
弱気
5月 25
百度は大規模モデル技術をベースにした「AI Partner」「AI BOT」「NEW APP」などの製品を社内でテスト中
強気
弱気
3月 10
百度が海外でAIチャットアプリ「WiseAI」をローンチ
強気3
弱気2
2月 16
Web3 ソーシャルネットワーク DeSo が、オープンソースのチャットプロトコルである DeSo Chat Protocol を開始
強気1
弱気
8月 24
Solana ベースのプロトコルのグループが力を合わせて、クロスチェーンメッセージング組織である「オープンチャットアライアンス」を立ち上げ、オープンソース標準による暗号化通信の簡素化を促進します
強気
弱気1

もっと

に関するその他のニュース open ai new chat

もっと

ChatGPTが進化：OpenAIのAIチャットボット、見て、聞いて、話せるようになる

視覚と音声生成を含むマルチモーダルAIシステムにリスクはあるか？

に関するその他のニュース open ai new chat

に関するその他のニュース open ai new chat

グーグル：ジェミニ2.0搭載AIエージェントでエージェント新時代を切り開く

イーロン・マスク、営利目的のAIスタートアップxAIの拡大にもかかわらず、利益追求の動機でOpen AIを提訴：ダブルスタンダードのケースか？

サムとアウトポグ：AOと人工知能を語る

OpenAI、「open.ai」ドメイン所有者との商標権争いに勝利

マイクロソフトがBing ChatをCopilotに改名、ChatGPTに直接挑戦

AIの誇大宣伝の中で偽のBing ChatGPTトークンがポップアップ

オープンメタバースの成功はユーザーエクスペリエンスにかかっています

Web3 新インフラ開発フォーラムと iPollo 新製品発表会

Web3 プラットフォームが Open Metaverse Alliance を開始

Etherescan が匿名向けの新しいメッセージング機能「Blockscan Chat」を追加

ChatGPTが進化：OpenAIのAIチャットボット、見て、聞いて、話せるようになる

視覚と音声生成を含むマルチモーダルAIシステムにリスクはあるか？

に関するその他のニュース open ai new chat

に関するその他のニュース open ai new chat

グーグル：ジェミニ2.0搭載AIエージェントでエージェント新時代を切り開く

イーロン・マスク、営利目的のAIスタートアップxAIの拡大にもかかわらず、利益追求の動機でOpen AIを提訴：ダブルスタンダードのケースか？

サムとアウトポグ：AOと人工知能を語る

OpenAI、「open.ai」ドメイン所有者との商標権争いに勝利

マイクロソフトがBing ChatをCopilotに改名、ChatGPTに直接挑戦

AIの誇大宣伝の中で偽のBing ChatGPTトークンがポップアップ

オープン メタバースの成功はユーザー エクスペリエンスにかかっています

Web3 新インフラ開発フォーラムと iPollo 新製品発表会

Web3 プラットフォームが Open Metaverse Alliance を開始

Etherescan が匿名向けの新しいメッセージング機能「Blockscan Chat」を追加

オープンメタバースの成功はユーザーエクスペリエンスにかかっています