ジーク、YBBキャピタル・リサーチャーによる
注目の新しさから始まる
過去1年間、暗号空間は、アプリケーション層の物語が崩壊し、インフラストラクチャの爆発的なスピードに追いつけなくなるにつれ、徐々に注目リソースの奪い合いゲームに変わってきた。SillyDragonからGoatまで、Pump.funからClankerまで、注目との恋愛は、注目のための戦いが途中で崩壊するのを見てきた。シリー・ドラゴンからヤギまで、Pump.funからClankerまで、注目を集めるための戦いは内向きなものであった。現金のための最も平凡な目玉から始まり、注目の需要者と提供者を一体化させるプラットフォーム・モデル、コンテンツの新たな供給者となったシリコンベースの生物へと急速に移行し、最後に、ミーム・コインの奇妙で多様なベクトルの中に、個人投資家とVCが同意できるものがある。">
投機は確かに物事の乱暴な成長に貢献することができるが、注目は結局ゼロサム・ゲームである。UNIについての記事で、ブロックチェーンの最後の黄金時代の始まりを思い起こしましたが、DeFiの急成長の原因は、Compound Financeが始めたLPマイニングの時代にあり、何千、何万ものアピーで様々なマイニングプールに出入りすることが、その時期のチェーン上での最も原始的なゲーム方法でした。最終的には、あらゆる種類のマイニングプールが崩壊し、そこら中に鶏と羽が生えたような状況でしたが。しかし、金採掘者の異常な流入はブロックチェーンに前例のない流動性を残し、DeFiは最終的に純粋な投機から飛び出して成熟した軌道を形成し、決済、取引、裁定取引、質権などの面でユーザーの金融ニーズを満たすようになった。AIエージェントも現段階ではこの野蛮な段階を経ており、私たちはCryptoがどのようにAIとよりよく統合し、最終的にアプリケーションレイヤーを新たな高みに押し上げることができるかを模索している。
第2回:知性体はいかにして自律化するのか
前回の記事では、AIミームの起源、トゥルース・ターミナル、そしてAIエージェントの未来についての展望を簡単に紹介しました。この記事では、何よりもまずAIエージェントそのものに焦点を当てます。
まず、AIエージェントの定義から始めましょう。これは、Autonomous(自律的)、つまり、環境を感知し、反映することができるあらゆるAIを強調する、AI空間における古くて定義が不明確な用語です。今日の定義では、AIエージェントはインテリジェント・ボディに近く、人間の意思決定を模倣する大規模なモデルを設定するシステムであり、AGI(一般人工知能)に向かう最も有望な方法であると学界では考えられています。
GPTの初期バージョンでは、大きなモデルが非常に人間に似ていることは明らかでしたが、多くの複雑な質問に対してもっともらしい答えを与えることしかできませんでした。本質的な理由は、当時のビッグモデルは因果関係ではなく確率に基づいていたこと、そして第二に、人間が持っている道具、記憶、計画などを使う能力が欠けていたことであり、AIエージェントはこれらの欠点を補うことができる。つまり、数式でまとめると、AIエージェント=LLM+プランニング+メモリー+ツールということになります。
促音語(Prompt)に基づく大きなモデルが、入力すると生命が宿る静的な人物に近いのに対し、知的身体はよりリアルな人物を目指す。現在、知能体のサークルは主にMetaオープンソースのLlama 70bまたは405bバージョン(2つのパラメータは異なる)の微調整モデルに基づいており、メモリとAPIアクセスツールを使用する機能を備えていますが、他の側面では人間の助けや入力(他の知能体との連携を含む)が必要な場合があり、知能体のサークルはまだ主にKOLの存在の形であることがわかります!ソーシャルネットワーク上知能体がより人間に近くなるためには、計画能力と行動能力へのアクセスが必要であり、計画におけるサブシンキングの連鎖は特に重要である。
第3回:思考の連鎖(CoT)
思考の連鎖(CoT)の概念が初めて登場したのは、グーグルが論文「Chain of Thought」を発表した2022年のことである。Googleは論文「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」を発表し、複雑な問題をよりよく理解し解決するために、一連の中間推論ステップを生成することでモデルを拡張できることを示唆した。
典型的なCoTプロンプトは3つの部分で構成されています。CoTは、数学的な問題解決、プロジェクトのレポート作成、その他の単純なタスクなど、深い分析と多段階の推論を必要とするタスクに特に適しています。タスク完了の質を向上させることができます。
CoTは、受け取った情報の意味を理解し、その情報に基づいて合理的な意思決定を行う必要があるAIエージェントを構築する上で重要な役割を果たします。 CoTは、構文解析の結果を具体的な行動指針に変換する方法について構造化された思考方法を提供することで、エージェントが効率的に入力を処理し、分析するのを助けます。このアプローチは、エージェントの意思決定の信頼性と効率を高めるだけでなく、意思決定プロセスの透明性を向上させ、エージェントの行動をより予測可能で追跡可能なものにします。 タスクを複数の小さなステップに分解することで、CoTはエージェントが各決定ポイントを慎重に検討するのを助け、情報過多による誤った決定の数を減らします。CoTは、エージェントの意思決定プロセスをより透明化し、ユーザがエージェントの意思決定の根拠を理解しやすくします。CoTは、エージェントが継続的に新しい情報を学習し、環境と相互作用しながら行動戦略を調整することを可能にします。
CoTは、大規模な言語モデルの推論能力を向上させるだけでなく、よりスマートで信頼性の高いAIエージェントを構築する上で重要な役割を果たす効果的な戦略です。CoTを活用することで、研究者や開発者は、複雑な環境に対してより適応性が高く、高度な自律性を持つインテリジェントシステムを構築することができる。CoTは、特に複雑なタスクを扱う際に、タスクを一連の小さなステップに分解することで、タスク解決の精度を向上させるだけでなく、モデルの解釈可能性と制御可能性を高めるなど、実用的なアプリケーションにおいて独自の利点を発揮している。このステップ・バイ・ステップの問題解決アプローチは、複雑なタスクに直面したときに、多すぎる情報や複雑すぎることが原因で起こる誤った意思決定を大幅に減らすことができる。同時に、このアプローチは、全体的なソリューションのトレーサビリティと検証可能性を向上させます。
CoTの核となる機能は、推論と行動のギャップを埋めるために、計画、行動、観察を互いに組み合わせることです。
CoTの中核機能は、計画と行動と観察を互いに組み合わせることで、推論と行動のギャップを埋めることです。この思考モードにより、AIエージェントは、起こりうる異常を予測する際に効果的な対策を立てることができるだけでなく、外部環境と相互作用しながら、新たな情報を蓄積し、あらかじめ決められた予測を検証し、推論の新たな基盤を提供することができます。
CoTは、AIエージェントが複雑な環境でも生産性を維持できるよう、精度と安定性の強力なエンジンとして機能します。
4:正しい擬似要件
暗号はAI技術スタックのどの側面と本当に統合する必要があるのでしょうか?昨年の投稿では、演算とデータの分散化が、中小企業や個人開発者のコスト削減を支援する重要なステップであると主張しましたが、Coinbaseがまとめた今年のCrypto x AIのトラックの内訳では、より詳細な区分が見られます:
(1)コンピュートレイヤー(グラフィック処理ユニット(GPU)を指す)(AIを提供することに重点を置いている)AIに開発者にグラフィックス・プロセッシング・ユニット(GPU)リソースを提供することに重点を置いている);
(2)データ層(AIデータパイプラインの分散型アクセス、オーケストレーション、検証をサポートするネットワークを指す);
(3)ミドルウェア層(AIの開発、デプロイ、ホスティングをサポートするネットワークを指す。
(4)アプリケーション層(B2BであれB2Cであれ、オンチェーンのAIメカニズムを活用したユーザー向けの製品を指す)。
これら4つの層にはそれぞれ野心的なビジョンがあり、その目標は要約すると、シリコンバレーの巨人がインターネットを支配する次の時代に対抗することである。昨年申し上げたように、私たちは本当にシリコンバレーの巨人による演算、データの独占的支配を受け入れるつもりなのだろうか?彼らの独占下にあるクローズドソースのビッグモデルは、ブラックボックスの中にあるもう一つのブラックボックスであり、科学は今日人類が最も信仰している宗教であるため、将来ビッグモデルが答えるすべての言葉は、人々の大部分によって真実とみなされるだろう。シリコンバレーの巨人たちのビジョンによれば、知的体はやがて想像を超えたアクセス権を持つようになり、例えば財布の代金を支払う権利や端末を使う権利を持つようになる。
非中央集権化が唯一の答えだが、こうした壮大なビジョンにどれだけの買い手がいるのか、合理的に総合的に考える必要がある時はあるのだろうか?かつては、事業閉鎖を考慮することなく、トークンで理想化の誤りを補うことができた。今は非常にシビアな状況であり、Crypto×AIは、例えば演算レイヤーの性能低下や不安定化が起きた場合に、供給の両端をどうバランスさせるかなど、実情を踏まえた設計が必要である。集中型クラウドとのマッチング競争力を実現するために。データレイヤープロジェクトにどれだけの実ユーザーがいるのか、提供されるデータの妥当性をどのように検証するのか、どのような顧客がデータを必要としているのか。同じことがレイヤー2の残りの部分にも当てはまり、今の時代に正しいと思われる多くの似非要件は必要ありません。
V.MemeはSocialFiを使い果たした
最初の段落で述べたように、MemeはWeb3に超高速でフィットするSocialFiの形を使い果たしました。Friend.techは、このソーシャルアプリのラウンドで最初に発砲したDappだが、トークンの設計で急遽失敗し、Pump.funは、トークンなし、ルールなしの純粋なプラットフォームの実現可能性を証明した。注目の需要者と供給者が一体化し、ストーキング写真を送ったり、ライブ放送をしたり、コインを送ったり、メッセージを残したり、プラットフォーム上で取引したりすることができ、すべてが無料で、Pump.funはサービス料だけを徴収する。これは基本的に今日のYouTube、Insや他のソーシャルメディアの注目経済モデルと同じですが、料金は異なっており、Pupm.funのゲームプレイは、よりWeb3.
一方、ベースのクランカーは、次のようなものです。BaseのClankerは、Ecoが個人的に取り組んだ統合エコシステムのおかげで傑作であり、Baseは完全な内部クローズドループを形成するための補助として独自のソーシャルDappを持っている。スマートボディのミームは、ミーム・コインの2.0形態である。 人々は常に新しい何かを求めており、Pump.funは偶然にも新しい何かの頂点にある。シリコンベースの生き物が、カーボンベースの生き物の下品さを気まぐれで置き換えるのは時間の問題だ。
ベースについては何度目かの言及になるが、その都度違った形で言及してきた。時系列で言えば、ベースは決して先発ではなかったが、常に勝者だった。
第6回:知的身体とは他にどんなものがあるのか?
実用的な観点から言えば、今後長い間、知性体を分散化することは不可能です。 従来のAI分野で知性体を構築するという観点から言えば、推論プロセスを分散化してオープンソース化するという単純な問題ではなく、Web2のコンテンツにアクセスするためにさまざまなAPIにアクセスする必要があり、実行にはコストがかかり、思考の連鎖の設計には費用がかかります。高価であり、思考の連鎖の設計や複数の知性のコラボレーションは、通常、依然として人間を媒介としている。おそらくUNIのような適切な収束の形が現れるまで、私たちは長い移行期を過ごすことになるだろう。しかし、前の記事と同様に、私たちの業界におけるCexの存在が正しくはないが重要であるように、インテリジェンスは私たちの業界に大きな影響を与えるだろうと私は感じている。
先月のStanford & Microsoftの "AI Agent Roundup "の記事には、ヘルスケア業界やスマートマシン、仮想世界でのインテリジェンスの使用について多くのことが書かれており、その記事の付録には、トップ3Aゲームの開発におけるインテリジェンスとしてのGPT-4Vの多くのテストケースがすでにあります。
分散化でスピードを追求しすぎることなく、私がインテリジェンスに埋めてほしいジグソーパズルの最初のピースは、ボトムアップの能力とスピードです。