Tác giả: 0XNATALIE
Kể từ nửa cuối năm nay, chủ đề về Tác nhân AI tiếp tục trở nên phổ biến. Lúc đầu, thiết bị đầu cuối chatbot AI của sự thật đã thu hút sự chú ý rộng rãi nhờ các bài đăng và câu trả lời hài hước trên X (tương tự như "Robert" trên Weibo) và nhận được 50.000 USD tài trợ từ người sáng lập a16z Marc Andreessen. Lấy cảm hứng từ những gì anh ấy đăng, ai đó đã tạo ra mã thông báo GOAT, mã thông báo này đã tăng hơn 10.000% chỉ sau 24 giờ. Chủ đề về AI Agent ngay lập tức thu hút sự chú ý của cộng đồng Web3. Sau đó, ai16z, quỹ giao dịch AI phi tập trung đầu tiên dựa trên Solana, đã ra mắt, đưa ra khung phát triển Đại lý AI Eliza và gây ra tranh chấp giữa các mã thông báo chữ hoa và chữ thường. Tuy nhiên, khái niệm về AI Agent của cộng đồng vẫn chưa rõ ràng: Cốt lõi của AI Agent là gì? Nó khác với bot giao dịch Telegram như thế nào?
Nguyên tắc hoạt động: nhận thức, lý luận và tự chủ ra quyết định
AI Agent là hệ thống tác nhân thông minh dựa trên mô hình ngôn ngữ lớn (LLM), có khả năng nhận thức môi trường, đưa ra lý luận quyết định và chuyển các công cụ Gọi hoặc thực hiện các hành động để hoàn thành các nhiệm vụ phức tạp. Quy trình làm việc: Mô-đun nhận thức (thu thập đầu vào) → LLM (hiểu, lý luận và lập kế hoạch) → Gọi công cụ (thực thi nhiệm vụ) → Phản hồi và tối ưu hóa (xác minh và điều chỉnh).
Cụ thể, Tác nhân AI trước tiên lấy dữ liệu (chẳng hạn như văn bản, âm thanh, hình ảnh, v.v.) từ môi trường bên ngoài thông qua mô-đun nhận thức và chuyển đổi nó thành thông tin có cấu trúc có thể xử lý được. Là một thành phần cốt lõi, LLM cung cấp khả năng hiểu và tạo ngôn ngữ tự nhiên mạnh mẽ, đóng vai trò là "bộ não" của hệ thống. Dựa trên dữ liệu đầu vào và kiến thức hiện có, LLM thực hiện suy luận logic và tạo ra các giải pháp khả thi hoặc phát triển các kế hoạch hành động. Sau đó, Tác nhân AI hoàn thành các nhiệm vụ cụ thể bằng cách gọi các công cụ, plugin hoặc API bên ngoài, đồng thời xác minh và điều chỉnh kết quả dựa trên phản hồi để hình thành tối ưu hóa vòng kín.
Trong các kịch bản ứng dụng Web3, sự khác biệt giữa robot giao dịch AI Agent và Telegram hoặc các tập lệnh tự động hóa là gì? Lấy chênh lệch giá làm ví dụ, người dùng hy vọng thực hiện các giao dịch chênh lệch giá với điều kiện lợi nhuận lớn hơn 1%. Trong bot giao dịch Telegram hỗ trợ chênh lệch giá, người dùng đặt chiến lược giao dịch với lợi nhuận lớn hơn 1% và Bot bắt đầu thực hiện. Tuy nhiên, khi thị trường biến động thường xuyên và các cơ hội kinh doanh chênh lệch giá liên tục thay đổi, các Bot này thiếu khả năng đánh giá rủi ro và sẽ thực hiện kinh doanh chênh lệch giá miễn là lợi nhuận lớn hơn 1%. Ngược lại, AI Agent có thể tự động điều chỉnh chính sách. Ví dụ: khi lợi nhuận của một giao dịch nhất định vượt quá 1%, nhưng rủi ro được đánh giá là quá cao thông qua phân tích dữ liệu và thị trường có thể thay đổi đột ngột và dẫn đến thua lỗ, nó sẽ quyết định không thực hiện kinh doanh chênh lệch giá.
Do đó, AI Agent có khả năng tự thích ứng và lợi thế cốt lõi của nó nằm ở khả năng học hỏi và đưa ra quyết định độc lập thông qua tương tác với môi trường (chẳng hạn như thị trường, hành vi người dùng , v.v.) và dựa trên phản hồi. Tín hiệu điều chỉnh các chiến lược hành vi để liên tục cải thiện hiệu quả thực hiện nhiệm vụ. Nó cũng có thể đưa ra quyết định theo thời gian thực dựa trên dữ liệu bên ngoài và liên tục tối ưu hóa các chiến lược ra quyết định thông qua học tập tăng cường.
Điều này nghe có vẻ hơi giống một công cụ giải quyết (slover) trong khung ý định phải không? Bản thân Tác nhân AI cũng là một sản phẩm dựa trên ý định. Điểm khác biệt lớn nhất so với trình giải trong khung ý định là trình giải dựa trên các thuật toán chính xác và nghiêm ngặt về mặt toán học, trong khi việc ra quyết định của Tác nhân AI dựa vào việc đào tạo dữ liệu, strong> Thường cần phải tiếp cận giải pháp tối ưu thông qua việc thử và sai liên tục trong quá trình đào tạo.
Khung chính của Tác nhân AI
Khung Tác nhân AI là cơ sở hạ tầng để tạo và quản lý các tác nhân thông minh. Hiện tại trong Web3, các khung phổ biến hơn bao gồm ai16z Eliza,zerebro ZerePy và Ảo span> TRÒ CHƠI của .
Eliza là một khung AI Agent đa chức năng được xây dựng bằng TypeScript, hỗ trợ chạy trên nhiều nền tảng (như Discord, Twitter, Telegram, v.v.) và thông qua quản lý bộ nhớ phức tạp, Khả năng ghi nhớ các cuộc trò chuyện và bối cảnh trước đó, đồng thời duy trì các phản ứng ổn định và nhất quán với đặc điểm tính cách và kiến thức. Eliza sử dụng hệ thống RAG (Retrieval Augmented Generation), hệ thống này có thể truy cập cơ sở dữ liệu hoặc tài nguyên bên ngoài để tạo ra câu trả lời chính xác hơn. Ngoài ra, Eliza tích hợp plug-in TEE cho phép triển khai trong TEE, đảm bảo tính bảo mật và quyền riêng tư dữ liệu.
GAME là một khuôn khổ trao quyền và thúc đẩy Tác nhân AI đưa ra các quyết định và hành động tự chủ. Các nhà phát triển có thể tùy chỉnh hành vi của tác nhân theo nhu cầu của họ, mở rộng chức năng của nó và cung cấp các hoạt động tùy chỉnh (chẳng hạn như đăng bài trên mạng xã hội, trả lời, v.v.). Các chức năng khác nhau trong khung, chẳng hạn như vị trí và nhiệm vụ môi trường của tác nhân, được chia thành nhiều mô-đun để tạo điều kiện cho các nhà phát triển định cấu hình và quản lý. Khung GAME chia quá trình ra quyết định của Tác nhân AI thành hai cấp độ: lập kế hoạch cấp cao (HLP) và lập kế hoạch cấp thấp (LLP), lần lượt chịu trách nhiệm về các cấp độ nhiệm vụ và quyết định khác nhau. Lập kế hoạch cấp cao chịu trách nhiệm thiết lập các mục tiêu tổng thể và lập kế hoạch nhiệm vụ của tác nhân, đưa ra quyết định dựa trên mục tiêu, tính cách, thông tin cơ bản và tình trạng môi trường cũng như xác định các ưu tiên của nhiệm vụ. Lập kế hoạch cấp thấp tập trung vào cấp độ thực hiện, chuyển các quyết định lập kế hoạch cấp cao thành các bước hoạt động cụ thể và lựa chọn các chức năng, phương pháp điều hành phù hợp.
ZerePy là một khung Python nguồn mở để triển khai Tác nhân AI trên X. Khung này tích hợp LLM do OpenAI và Anthropic cung cấp, cho phép các nhà phát triển xây dựng và quản lý các tác nhân truyền thông xã hội cũng như tự động hóa các hoạt động như đăng tweet, trả lời tweet và lượt thích. Mỗi nhiệm vụ có thể được gán một trọng số khác nhau dựa trên tầm quan trọng của nó. ZerePy cung cấp giao diện dòng lệnh (CLI) đơn giản để hỗ trợ các nhà phát triển nhanh chóng khởi động và quản lý các tác nhân. Đồng thời, khung này cũng cung cấp mẫu Replit (nền tảng thực thi và chỉnh sửa mã trực tuyến) mà qua đó các nhà phát triển có thể nhanh chóng bắt đầu sử dụng ZerePy mà không cần cấu hình môi trường cục bộ phức tạp.
Tại sao Đặc vụ AI phải đối mặt với FUD?
AI Agent có vẻ thông minh và có thể hạ thấp rào cản gia nhập cũng như cải thiện trải nghiệm người dùng. Tại sao vẫn còn FUD trong cộng đồng? Lý do là AI Agent thực chất vẫn chỉ là một công cụ và chưa thể hoàn thành toàn bộ quy trình làm việc. Nó chỉ có thể nâng cao hiệu quả và tiết kiệm thời gian ở một số nút nhất định. Và ở giai đoạn phát triển hiện tại, vai trò của AI Agent chủ yếu tập trung vào việc giúp người dùng cấp MeMe và vận hành các tài khoản mạng xã hội chỉ bằng một cú nhấp chuột. Cộng đồng gọi đùa nó là “tài sản thuộc về Dev, khả năng thuộc về AI”.
Tuy nhiên, chỉ trong tuần này aiPool đã được phát hành dưới dạng Đại lý AI để bán trước mã thông báo, sử dụng công nghệ TEE để đạt được sự tin cậy. Khóa riêng của ví AI Agent được tạo động trong môi trường TEE để đảm bảo an ninh. Người dùng có thể gửi tiền (chẳng hạn như SOL) đến ví do Tác nhân AI kiểm soát, sau đó tạo mã thông báo theo các quy tắc đã đặt và khởi chạy nhóm thanh khoản trên DEX trong khi phân phối mã thông báo cho các nhà đầu tư đủ điều kiện. Toàn bộ quá trình không cần phụ thuộc vào bất kỳ bên trung gian thứ ba nào và được AI Agent hoàn thành hoàn toàn độc lập trong môi trường TEE, tránh rủi ro kéo thảm thường gặp trong DeFi. Có thể thấy AI Agent đang dần phát triển. Tôi tin rằng AI Agent có thể giúp người dùng hạ thấp ngưỡng và cải thiện trải nghiệm của họ, ngay cả khi nó chỉ đơn giản hóa một phần quy trình phát hành tài sản, điều này rất có ý nghĩa. Tuy nhiên, từ góc độ Web3 vĩ mô, AI Agent, với tư cách là một sản phẩm ngoài chuỗi, hiện chỉ đóng vai trò là công cụ hỗ trợ các hợp đồng thông minh, do đó không cần phải khoe khoang quá mức về khả năng của nó. Vì không có câu chuyện đáng kể nào về hiệu ứng tài sản ngoài MeMe trong nửa cuối năm nay nên việc cường điệu về Đặc vụ AI xoay quanh MeMe là điều bình thường. Riêng MeMe không thể duy trì giá trị lâu dài, vì vậy nếu AI Agent có thể mang lại những cách thức sáng tạo hơn cho quá trình giao dịch và cung cấp giá trị triển khai hữu hình, nó có thể phát triển thành một công cụ hạ tầng phổ quát.