著者:Accelxr, 1KX; 翻訳者:0xjs@GoldenFinance
現在の生成モデルの主な目的は、コンテンツの作成と情報のフィルタリングです。しかし、AIインテリジェンス(ユーザーが定義した目標を達成するために外部ツールを使用する自律的な参加者)に関する最近の研究や議論は、1990年代のインターネットと同様の経済的アクセスが提供されれば、AIが実質的に解き放たれる可能性があることを示唆しています。
そのためには、従来の金融システムは彼らのために設定されていないため、インテリジェンスがコントロールできる資産に対する代理権を持つ必要があります。
そこで登場するのが暗号です。暗号は、AIインテリジェンスの構築に特に適している、高速決済とデジタル化による支払いと所有のレイヤーを提供します。
この記事では、インテリジェンスとインテリジェンスアーキテクチャの概念、インテリジェンスが伝統的なLLMを超える創発的特性を持つことを示す研究例、暗号ベースのインテリジェンスを中心としたソリューションや製品を構築するプロジェクトについて紹介します。
知能体とは
AIの知能体は、LLM主導のエンティティであり、複数回の繰り返しで目標を達成するために計画を立て、行動を起こすことができます。
知的体のアーキテクチャは、問題を解決するために協働する単一のみ、または複数の知的体から構成されます。
多くの場合、各インテリジェンスには個性が与えられ、独立して、あるいはチームの一員として仕事をするのに役立つツールを利用できる。
インテリジェンスのアーキテクチャは、今日私たちが一般的にLLMと対話する方法とは異なります。
ゼロプロンプティングは、ほとんどの人がこれらのモデルと対話する方法です:プロンプトを入力すると、LLMは既存の知識に基づいて応答を生成します。
知的身体アーキテクチャでは、ゴールを初期化し、LLMはそれをサブタスクに分解し、ゴールに到達するまで、各サブタスクを自律的に完了するよう、自分自身(または他のモデル)に再帰的に促します。
シングルインテリジェンス vs. マルチインテリジェンスアーキテクチャ
シングルインテリジェンスアーキテクチャ:1つの言語モデルがすべての推論、プランニング、ツールの実行を独自に行う。他の知能からのフィードバックメカニズムはありませんが、人間は知能にフィードバックを提供することを選択できます。
マルチインテリジェンスアーキテクチャ:2つ以上のインテリジェンスを含み、それぞれが同じ言語モデルまたは異なる言語モデルのセットを使用できる。インテリジェンスは同じツールを使用することも、異なるツールを使用することもできます。各知能体は通常、独自の役割を持っている。
知能体のアーキテクチャ:プロファイル
知能体には、LLMの行動やスキルに影響を与える手がかりとして役割を定義するプロファイルや個性があります。これは特定の用途に大きく依存します。
今日、多くの人がこれをプロンプトのテクニックとして使っていると思われます:「あなたは栄養の専門家です。私に食事計画を提供してください......"..興味深いことに、LLMに役割を提供することで、ベースラインと比較してアウトプットを向上させることができます。
プロファイルは以下の方法で作成することができます:
手動:人間の作成者が手動でプロファイルを指定する。
LLM-generated: LLMを使って生成されたプロファイルで、構成と属性に関するルールセットと、(オプションで)少数のサンプル例を含みます。
データセットアライメント:プロファイルは、実際の人々のデータセットに基づいて生成されます。
知的体のアーキテクチャ:記憶
知的体の記憶は、環境から知覚した情報を保存し、この情報を使って新しい計画や行動を策定します。記憶によって、知性体は自らの経験に基づいて進化し、行動することができる。
Unified Memory(統合記憶):文脈学習によって/持続的な促しによって達成される短期記憶に似ている。関連する記憶はすべて、合図ごとに知能に渡される。コンテキストウィンドウのサイズによって大きく制限される。
ハイブリッド:短期記憶+長期記憶。短期記憶は現在の状態の一時的なバッファである。反映された、または有用な長期的情報は、データベースに恒久的に保存されます。これを行うにはいくつかの方法があるが、一般的なアプローチは、ベクトル・データベース(記憶を埋め込みとしてエンコードして保存する。>インテリジェント・ボディ・アーキテクチャ:計画
複雑なタスクをより単純なサブタスクに分解し、個別に解決する。
フィードバックのない計画:
このアプローチでは、知能は将来の行動に影響を与えるフィードバックを受け取ることなく行動を起こします。この例として、LLMが回答を提供する際に思考プロセスを表現することを奨励する「思考の連鎖(CoT)」があります。
Single-path reasoning(例:0回CoT)
Multiple-path reasoning(例:self-consistent CoT。頻度の高い答え)
外部プランナー(例えば、プランニングドメイン定義言語)
フィードバックを伴うプランニング:
外部フィードバックに基づいてサブタスクを反復的に改良する
環境からのフィードバック(例:ゲームのタスク完了シグナル)
人からのフィードバック(例:ユーザーからフィードバックを募る)
モデルからのフィードバック(例:別のLLMからフィードバックを募る-クラウドソーシング)
Intelligent Body Architecture: Behaviour (Action)
Action (行動)は、知的体の決定を具体的な結果に変換する役割を担っています。
行動目標には、以下のようなさまざまな形が考えられます。p>
コミュニケーション(例:他の知性や人間と情報を共有する)
環境探索(例:自分の行動空間を探索し、自分の能力を知る)。
行動は通常、記憶の想起や計画に従って生成され、行動空間は内部知識、API、データベース/知識ベース、自分自身の使用に関する外部モデルから構成されます。
知能のためのアーキテクチャ:能力の獲得
知能が行動空間内で正しく行動を行うためには、タスクに特化した能力を持たなければならない。
文献における知能の例
生成知能:人間の行動のインタラクティブなシミュレーション:仮想サンドボックス環境で生成知能をインスタンス化すると、創発的な社会的行動を持つ多知能システムが示される。ユーザーが指定したバレンタイン・パーティーのプロンプト1つから始まり、知能は次の2日間、自動的に招待状を送り、新しい人々と出会い、互いにデートし、適切な時間に一緒にパーティーに出席するように調整する。a16z AI Townの実装を使えば、自分で試すことができる。
Description of Explanation of Plan Selection (DEPS) : 70以上のMinecraftタスクをこなすことができる、初のゼロサンプル マルチタスク インテリジェンスです。
Voyager: Minecraft初のLLM搭載インテリジェンスで、生涯学習を体現し、人間の介入なしに常に世界を探索し、スキルを習得し、新しい発見をします。繰り返される試行からのフィードバックに基づいて、スキルの実行コードを継続的に改善します。
CALYPSO: ゲーム「ダンジョンズ&ドラゴンズ」のために設計されたインテリジェンスで、ダンジョンマスターが物語を作り、語るのを支援します。その短期記憶はシーンの説明、モンスター情報、過去の要約に基づいている。
Ghost in Minecraft (GITM): 平均的なMinecraftの知能で、ダイヤモンドの獲得成功率は67.5%、すべてのゲーム内アイテムの完成率は100%です。
SayPlan:3Dシーンのグラフィカル表現を用いた、LLMベースのロボット向け大規模タスクプランニング。抽象化と自然言語指示からロボットの長期タスクプランニングを行う能力を実証。
HuggingGPT : ユーザのプロンプトに基づくChatGPTを用いたタスク計画、ハグ顔上の記述に基づくモデルの選択、全てのサブタスクの実行を行い、言語、視覚、発話、その他の困難なタスクにおいて印象的な結果を示した。
MetaGPT: ユーザーストーリー/競合分析/要件/データ構造/API/ドキュメントなどの入力を受け付け、出力する。内部的には、ソフトウェア会社のさまざまな機能を構成する複数のインテリジェンスがあります。
ChemCrow:有機合成、創薬、材料設計などのタスクを、18のエキスパートが設計したツールを使って実行するように設計されたLLM化学インテリジェンス。昆虫忌避剤、3つの有機触媒の合成を自律的に計画・実行し、新規発色団の発見を導く。
BabyAGI : OpenAIとChromaやWeaviateのようなベクターデータベースを使用して、タスクを作成、優先順位付け、実行するための共通インフラストラクチャです。
AutoGPT : LLMインテリジェンスを起動するための汎用インフラのもう1つの例です。
暗号におけるインテリジェンシアの例
(注意: すべての例がLLMに基づいているわけではなく、もっと緩やかにインテリジェンシアの概念に基づいている場合もあります)
RitualnetのFrenRug: GPT-4 Turkish Carpet Salesmanに基づいています。ゲーム{ https:// aiadventure.spiel.com/carpet }に基づいている。Frenrugは、誰でも自分のFriend.techキーを買うように説得できるブローカーである。各ユーザーメッセージは、異なるInfernetノードが運営する複数のLLMに渡される。十分な数のノードが応答すると、投票が集約され、教師付き分類器モデルが動作を決定し、マルチ分類器のオフチェーン実行の検証を可能にする有効性の証明をチェーン上に渡します。
Autonolas を使ったGnosis上の予測市場インテリジェンスボット: AIボットは基本的に、支払いや質問によって誰でも呼び出すことができるAIサービスのスマートコントラクトラッパーです。サービスはリクエストを監視し、タスクを実行し、チェーン上に答えを返します。このAIボット・インフラストラクチャは、Omenを通じて予測市場に拡張された。基本的な考え方は、インテリジェンスがニュース分析からの予測を積極的に監視して賭け、最終的に真のオッズに近い集約された予測を導き出すというものだ。インテリジェンスはオーメン上で市場を検索し、自律的に「ボット」にトピックに関する予測を支払い、市場を利用して取引を行う。
ianDAOs GPT<> Safe demo: GPTは、syndicateio trading cloud APIを使用して、独自のBaseチェーン上のSafeマルチシグネチャウォレットでUSDCを自律的に管理します。あなたの提案に基づいて割り当てを行います。
ゲームインテリジェンシア: ここには複数のアイデアがありますが、簡単に言うと、仮想環境におけるAIインテリジェンシアは(『スカイリム』のAI NPCのような)仲間であり、(ぽっちゃりしたペンギンのグループのような)競争相手でもあるということです。インテリゲンチャは収益戦略を自動化したり、商品やサービスを提供したり(たとえば店主や旅商人、洗練された生成クエストのプロバイダーなど)、あるいは『パラレル コロニー』や『Aiアリーナ』のような半プレイアブル キャラクターになることもできます。
Safe Guardian Angels: AIインテリジェンスのセットを使用してウォレットを監視し、潜在的な脅威から守ることで、ユーザーの資金を保護し、ウォレットのセキュリティを向上させます。機能には、異常やハッキングが発生した場合の契約権限の自動取り消しや資金の引き出しが含まれます。
Botto: Bottoはオンチェーンスマートの緩やかに定義された例ですが、自律的なオンチェーンアーティストのコンセプトを示しています。マルチモーダル・スマートボディ・アーキテクチャを使った様々な拡張が想像できる。
注目すべきスマートボディプロジェクト
(注:すべてのプロジェクトがLLMに基づいているわけではありません、契約、契約標準、資産、機能、API機能、ルーチン、パス分散型知識グラフ(つまり、パスファインダーのインテリジェンスがナビゲートできるブロックチェーンエコシステムの仮想ロードマップ)。ユーザーは、インテリジェンスが使用する実行可能なパスを特定することで報酬を得ることができる。さらに、キャラクターのセットアップやスキルのアクティベーションを含むシェル(=知性)をキャストし、それをパスファインダーのナレッジグラフにプラグインすることができます。
Ritualnet - Ritual infernetノードは、上記のfrenrugの例にあるように、複数の知性体のアーキテクチャーをセットアップするために使用できます。このノードはオンチェーンまたはオフチェーンのリクエストをリッスンし、オプションの証明で出力を提供します。
Morpheus - ユーザーの代わりにスマートコントラクトを実行できる個人向け汎用AIのピアツーピアネットワーク。これは、web3ウォレットとtxインテント管理、チャットボットインターフェイスを通じたデータ解析、dappsとコントラクトのレコメンデーションモデリング、アプリとユーザーデータを接続する長期記憶によるスマートボディ操作の拡張に使用できます。
Dain Protocol - Solana上でインテリジェンスを展開するための複数のユースケースを探求しています。
Naptha(ナプタ) - スマートボディのオーケストレーションプロトコル。
Naptha - インテリジェンスのためのオンチェーンタスクのマーケットプレイス、タスクをオーケストレーションするためのオペレータノード、異なるノード間の非同期メッセージングをサポートするLLMワークフローオーケストレーションエンジン、実行を検証するためのワークフロー認証システム。
Myshell - http:// character.aiに似たAIキャラクタープラットフォームで、クリエイターはスマートボディのプロファイルやツールを収益化できる。翻訳、教育、コンパニオンシップ、コーディングなど、興味深いインテリジェンス例を含むマルチモーダルインフラストラクチャ。シンプルなコードなしのスマートボディ作成と、AIウィジェットを組み立てるためのより高度な開発者モードが含まれています。
AI Arena - プレイヤーはAIを搭載したNFTを購入し、訓練し、対戦することができる対戦型PvP格闘ゲームです。プレイヤーは模倣による学習によってAIがプレイヤーの行動の相関関係を学習することで、インテリジェントボディNFTを訓練します。プレイヤーは模倣を通じて知能体NFTを訓練します。AIはプレイヤーの行動に関連する確率を学習することで、さまざまなマップやシナリオでのゲームの進め方を学びます。トレーニング後、プレイヤーは自分のインテリジェンスをランク戦に送り込み、トークン報酬を得ることができる。LLMをベースにしているわけではありませんが、それでもインテリジェントボディゲーミングの可能性を示す興味深い例です。
Virtuals Protocol - マルチモーダルインテリジェンスをゲームやその他のオンライン空間に構築し、展開するためのプロトコルです。今日のバーチャルの3つの主な原型には、IPキャラクターミラー、機能別インテリジェンス、パーソナルスタンドインが含まれます。貢献者はデータやモデルをバーチャルに提供し、検証者はゲートキーパーの役割を果たす。開発と収益化を促進するために、経済的なレベルのインセンティブが存在します。
Brianknows - ユーザーが取引を実行し、暗号通貨固有の情報を調査し、スマートコントラクトをタイムリーに展開できるインテリジェンスと対話するためのユーザーインターフェースを提供する。現在、100以上の統合のうち10以上のオペレーションをサポートしている。
Autonolas - 軽量なローカルおよびクラウドベースのスマートボディ、コンセンサスで運営される分散型スマートボディ、特殊なスマートボディエコノミーを提供。主な例として、DeFiおよび予測ベースのインテリジェンス、AI主導のガバナンス表現、インテリジェンス・ツー・インテリジェンス(エージェント間)ツールのマーケットプレイスなどがある。インテリジェンスの運用をオーケストレーションし、インセンティブを与えるためのプロトコルと、開発者が共同所有可能なインテリジェンスを構築するためのオープンソースフレームワークであるOLASスタックを提供します。
Creator.Bid - XとFarcasterのリアルタイムAPIにリンクされたソーシャルメディアのペルソナインテリジェンスをユーザーに提供します。ブランドは知識ベースのインテリジェンスを立ち上げて、ソーシャルプラットフォーム全体でブランドに沿ったコンテンツを実行することができます。
Polywrap - Indexer (Farcasterのソーシャルメディアインテリジェンス)、AutoTx (Morpheusとflock.ioを使用して構築)、予測、取引実行インテリジェンスなど、様々なインテリジェンスベースの製品を提供しています。プランニングと取引実行のインテリジェンス)、predictionprophet.ai(GnosisとAutonolasによる予測インテリジェンス)、fundpublicgoods.ai(適切なリソース配分のためのインテリジェンス)などです。
検証 - 経済の流れはインテリジェンスによって導かれるため、アウトプットの検証は非常に重要になります(これについては後の記事で詳しく説明します)。検証方法には、Ora ProtocolのzkML、Modulus Labs+Giza+ EZKLなどのチームのzkML、ゲーム理論のソリューション、TEEのようなハードウェアベースのソリューションなどがあります。
オンチェーンインテリジェンスについての考察
所有可能で、取引可能で、トークンゲートされたインテリジェンスは、交友関係から金融アプリケーションまで、あらゆる種類の機能を実行します。
あなたの代わりに認識し、学習し、ゲーム経済に参加することができる知性体、または共同作業、競争、または完全にシミュレートされた環境でプレイヤーとして行動することができる自律的な知性体です。
収益機会のために実際の人間の行動を模倣することができるインテリジェンス
自律的な資産管理者として行動できる複数のインテリジェンスによって管理されるスマートウォレット
AIが管理するDAOのガバナンス(トークンの委任、提案の作成または管理、プロセスの改善など)
AIが管理するDAOのガバナンス(トークンの委任、提案の作成または管理、プロセスの改善など)
AIが管理するDAOのガバナンス(トークンの委任、提案の作成または管理、プロセスの改善などli>
共有された永続的なメモリ状態のためのコンポーザブルなベクトル埋め込みシステムとして、Web3ストレージまたはデータベースを使用する
グローバルなコンセンサスネットワークに参加し、ユーザー定義のタスクを実行する、ローカルで実行するインテリジェンス
既存および新規のプロトコル相互作用やAPIのためのナレッジグラフ
自律的なガーディアンネットワーク、マルチシグネチャセキュリティ、スマートコントラクトのセキュリティと機能強化
真に自律的な投資DAO(例えば、美術史家、投資アナリスト、データアナリスト、ディジェンインテリゲンチャの役割を使用するコレクターDAO)
トークン経済学とコントラクトセキュリティのシミュレーションおよび
一般的なインテント管理、特にブリッジングやDeFiのような暗号ユーザーエクスペリエンスの文脈で
芸術的または実験的なプロジェクト
次の10億ユーザーを惹きつける
Varaint Fundの共同設立者であるJesseすでにプロトコルタスクボット、スナイパーボット、MEVサーチャー、ボットキットなどがある。インテリジェンティアはその延長に過ぎない。
暗号の多くの分野は、完全なオンチェーンゲームやDeFiなど、知的体の実行に有利な方法で構築されています。LLMのコストがタスクのパフォーマンスに対して下降傾向にあり、インテリジェンスの作成と展開のアクセシビリティが高まっていると仮定すると、AIインテリジェンスがオンチェーンでのやり取りを支配し、暗号の次の10億人のユーザーにならない世界を想像するのは難しいでしょう。
読み物:
ブロックチェーンを使って自ら銀行取引できるAIエージェント
新しいAIエージェント経済は、スマートアカウント上で実行される
A大規模言語モデルベースの自律エージェントに関する調査(上記のエージェントアーキテクチャの分類法を特定するために使用しました。)nbsp;
ReAct: Synergizing Reasoning and Acting in Language Models
Generative agents: Interactive simulacra of human behaviour
.
Reflexion:言語強化学習による言語エージェント
Toolformer:言語モデルは道具の使い方を自ら教えることができる
。Describe(記述)、Explain(説明)、Plan(計画)、Select(選択): Large Language Models(大規模言語モデル)によるインタラクティブなプランニングがオープンワールドのマルチタスクエージェントを可能にする
Voyager(ボイジャー): An Open-Ended Embodied Agent(オープンエンドの体現型エージェント)。大規模言語モデルによるオープンエンドの具現化エージェント
LLM Agents Papers GitHub Repo
元記事へのリンク