Tác giả: Josh Ho & Teng Yan, Chain of Thought Dịch: Golden Finance xiaozou
Bài viết này , Chúng ta sẽ tìm hiểu sâu về Hyperbolic, một dịch vụ đám mây AI truy cập mở phổ biến. Sứ mệnh đầy tham vọng của Hyperbolic là làm cho AI dễ tiếp cận hơn bằng cách cung cấp sức mạnh tính toán suy luận với giá cả phải chăng.
Nhưng trước đó, hãy xem những điều chúng tôi nghĩ là thú vị nhất về Hyperbolic...
1,Bí mật của Hyperbolic——Bằng chứng lấy mẫu
Hyperbolic đang giải quyết một cách nhân tạo Một trong những thách thức khó khăn nhất trong lĩnh vực trí thông minh xuất hiện Trước hết: xác minh xem đầu ra có thực sự đến từ một mô hình AI cụ thể hay không.
Vấn đề này đặc biệt khó khăn đối với các nhà cung cấp nguồn đóng tập trung như OpenAI. Khi bạn yêu cầu đầu ra từ GPT-4, làm thế nào bạn có thể chắc chắn rằng mình không bị lừa - chẳng hạn như OpenAI chạy mô hình GPT-3.5 rẻ hơn (1/20 giá mỗi mã thông báo)?
Hiện tại, những đảm bảo như vậy dựa vào danh tiếng, nhưng Hyperbolic tin rằng vấn đề này nên được xử lý theo cách không cần sự tin cậy và phi tập trung.
Hiện có một số cách để thực hiện việc này:
· Lạc quanHọc máy ( strong>OpML): Giả sử rằng tất cả các giao dịch đều hợp lệ trừ khi bị người xác thực thách thức.
· Học máy không có kiến thức(zkML): Sử dụng mạch ZK để xác minh rằng các phép tính được thực hiện chính xác.
Tuy nhiên, cả hai đều có những hạn chế:
· OpML Việc phụ thuộc vào người xác thực để kiểm tra kết quả đã làm trì hoãn quyết định cuối cùng do thời gian tranh chấp. Ngoài ra, còn thiếu các biện pháp khuyến khích nội tại để đảm bảo rằng người xác thực hành xử một cách chính trực.
· zkML rất tốn kém về mặt tính toán, thậm chí đôi khi phải mất nhiều ngày để tạo bằng chứng mô hình lớn với hơn 70B tham số .
Hyperbolic nhằm mục đích khắc phục những thiếu sót này thông qua giao thức Bằng chứng lấy mẫu (PoSP) và Máy học lấy mẫu (SpML). SpML sử dụng lý thuyết trò chơi và lấy mẫu để khuyến khích hành vi trung thực mà không cần giám sát liên tục.
Nó dựa trên một khái niệm lý thuyết trò chơi chiến lược thuần túy có tên là Cân bằng Nash, trong đó tất cả những người tham gia đều có động cơ rõ ràng để hành động một cách liêm chính. Bởi vì chi phí của việc gian lận lớn hơn tiềm năng. những lợi ích.
Cách đơn giản nhất để nghĩ về nó là tưởng tượng về nó như một hệ thống bán vé xe buýt.
Người kiểm tra vé chỉ tiến hành kiểm tra ngẫu nhiên, vì vậy bạn có thể nghĩ rằng hành khách thường có nguy cơ trốn vé. Nhưng đáng ngạc nhiên là họ không làm điều này vì hình phạt trốn vé đủ mạnh để răn đe hành khách gian lận. Miễn là số tiền phạt vượt xa chi phí mua vé thì tính chính trực sẽ được ưu tiên.
SpML của Hyperbolic sử dụng các biện pháp khuyến khích tài chính để giải quyết các hạn chế của cơ chế xác minh hiện tại như OpML và zkML. Nó cung cấp sự cân bằng tốt giữa tốc độ và bảo mật mà không phải chịu gánh nặng tính toán nặng nề.
Chúng ta nên chú ý điều gì? Đó là giả định rằng mọi người đều cư xử hợp lý, điều này không phải lúc nào cũng đúng.
Nếu SpML hoạt động tốt trong thực tế, nó sẽ thay đổi luật chơi đối với các ứng dụng AI phi tập trung, biến suy luận được xác minh không đáng tin cậy thành hiện thực.
2, điện toán chi phí thấp có thể mở rộng
Đào tạo AI rất tốn kém. Khả năng tiếp cận nguồn điện và máy tính là những chi phí lớn nhất mà các doanh nghiệp và công ty khởi nghiệp phải đối mặt. Chi phí năng lượng tính toán cần thiết để đào tạo các mô hình gần như tăng gấp đôi sau mỗi 9 tháng.
Chi phí của GPT-3 vào năm 2020 là khoảng 4 triệu đô la Mỹ, trong khi chi phí đào tạo tính toán của GPT-4 vào năm 2023 lên tới 190 triệu đô la Mỹ, một con số đáng kinh ngạc.
Chỉ những tổ chức có đủ nguồn lực mới có thể tồn tại. Những người chơi nhỏ hơn và những người đam mê bị loại khỏi thị trường bởi chi phí cắt cổ. Một postdoc ở Stanford đã phải dừng nghiên cứu của mình vì anh ta không đủ tiền mua hàng nghìn GPU mà anh ta cần.
Thách thức lớn trong mạng điện toán phi tập trung là quản lý phần cứng không đồng nhất—không chỉ các chip Nvidia hàng đầu; .
Hệ điều hành phi tập trung của Hyperbolic là cốt lõi của mạng máy tính. Nó sẽ tập hợp liền mạch các tài nguyên với khả năng tự động điều chỉnh quy mô và khả năng chịu lỗi được tích hợp sẵn.
Bước đột phá của Hyperbolic nằm ở cách tiếp cận sự phức tạp này.
· Nó mang đến sự linh hoạt bằng cách tối ưu hóa các hoạt động tensor trên các phần cứng khác nhau, từ Nvidia đến GPU AMD.
· Ngăn xếp biên dịch của Hyperbolic trừu tượng hóa sự phức tạp, cho phép các nhà phát triển đạt được hiệu suất cao trên các thiết lập GPU khác nhau mà không bị sa lầy vào tình thế tiến thoái lưỡng nan về triển khai và cấu hình.
Các thị trường khác có thể cung cấp GPU phi tập trung nhưng chúng thường thiếu các tính năng tối ưu hóa phức tạp mà Hyperbolic có thể cung cấp, đặt gánh nặng điều chỉnh hiệu suất lên người dùng.
Hyperbolic đơn giản hóa việc này thông qua API cung cấp quyền truy cập vào các mô hình AI được tối ưu hóa cho nhiều loại phần cứng, giúp tài nguyên máy tính của thế giới dễ truy cập hơn.
Vào ngày 15 tháng 8, Hyperbolic đã phát hành phiên bản giới hạn alpha của thị trường GPU, cho phép 100 thành viên đang chờ dùng thử tính năng cho thuê GPU.
3, AILớp dịch vụ
Thành phần tiếp theo của hệ sinh thái trí tuệ nhân tạo Hyperbolic là lớp dịch vụ AI, cung cấp các chức năng như suy luận, đào tạo mô hình, đánh giá mô hình và tạo tăng cường truy xuất (RAG).
Trong ứng dụng Hyperbolic, bạn có thể dễ dàng chạy các mô hình nguồn mở hàng đầu như Llama 3.1 405B và Hermes 370B. Để tinh chỉnh đầu ra, bạn có thể điều chỉnh các siêu tham số như mã thông báo tối đa, nhiệt độ và P.
Nền tảng Hyperbolic mở ra cánh cửa cho các ứng dụng trí tuệ nhân tạo đổi mới, bao gồm:
· AIDoanh thu từ đại lý chia sẻ:Mã hóa quyền sở hữu của các đại lý AI để phân phối lại doanh thu.
· Trí tuệ nhân tạoDAO: Sử dụng trí tuệ nhân tạo để quản trị ra quyết định.
· ChiaGPUQuyền sở hữu:Cho phép người dùng sở hữu và giao dịch GPU một phần.
4Tiền điện tử đóng vai trò gì?
Cốt lõi của cơ sở hạ tầng Hyperbolic là blockchain, hỗ trợ các lớp điều phối, dịch vụ và xác minh. Blockchain xử lý việc giải quyết và quản trị cho đám mây AI nguồn mở của Hyperbolic. Nó cũng hỗ trợ cơ chế phân xử và xác minh của công nghệ PoSP.
Mặc dù vẫn còn rất ít nội dung cụ thể về blockchain nhưng bạn có thể mong đợi Hyperbolic sẽ sớm tiết lộ thêm về nó.
5, cấp nghiên cứuAlpha
Hyperbolic vẫn đang trong giai đoạn testnet. Họ đã huy động được 7 triệu đô la trong vòng hạt giống do Polychain Capital và Lightspeed Faction dẫn đầu.
Thật thú vị, Hyperbolic là nhà cung cấp độc quyền mẫu Llama 3.1 405B Base.
Mô hình cơ sở là phiên bản được đào tạo trước ban đầu của LLM mà không cần tinh chỉnh hoặc học tăng cường với phản hồi của con người (RLHF). Nó có những ưu điểm sau:
· Hỗ trợ toàn diện để tinh chỉnh các tác vụ cụ thể
· Là điểm khởi đầu cho các kỹ thuật trí tuệ nhân tạo tiên tiến, chẳng hạn như tạo dữ liệu tổng hợp hoặc chắt lọc mô hình.
6, Giới thiệu về nhóm
Tiến sĩ Jasper (Yue) Zhang là người đồng sáng lập người sáng lập và Giám đốc điều hành của Hyperbolic Labs. Trước đây ông là nhà nghiên cứu blockchain cao cấp tại Ava Labs và nhà nghiên cứu định lượng tại Citadel Securities. Anh lấy bằng Tiến sĩ toán học tại Đại học California, Berkeley trong vòng hai năm và giành huy chương vàng trong cả Cuộc thi Toán học Toàn cầu Alibaba và Olympic Toán học Trung Quốc.
Tiến sĩ Yuchen Jin là người đồng sáng lập và giám đốc công nghệ của Hyperbolic Labs. Ông có bằng Tiến sĩ về Hệ thống và Mạng Máy tính của Đại học Washington. Trước đây anh từng làm việc tại OctoML, một công ty cung cấp cơ sở hạ tầng để chạy, điều chỉnh và mở rộng quy mô các ứng dụng AI tổng hợp.
7Một số suy nghĩ của chúng tôi
Nhìn chung, chúng tôi rất vui mừng về Hyperbolic. Họ chắc chắn là một trong những đội đáng chú ý nhất trong lĩnh vực Crypto AI.
Hyperbolic không chỉ là nhà cung cấp sức mạnh điện toán, những cải tiến như PoSP và SpML còn bổ sung thêm các lớp xác minh và tin cậy mới cho AI phi tập trung.
Thật thú vị khi thử nghiệm các mô hình cơ sở trên Hyperbolic, đặc biệt vì họ là một trong số ít nhà cung cấp hiện có thể triển khai tính năng này. Chúng ta hoàn toàn có thể tin tưởng vào cam kết của họ đối với AI nguồn mở.
Vài tuần trước, chúng tôi đã viết về Prime Intellect. Vẫn còn phải xem liệu Hyperbolic có tập trung vào đào tạo AI phân tán như Prime Intellect hay không.
Mặc dù chúng tôi lưu ý rằng nhu cầu về sức mạnh tính toán nói chung là thưa thớt, nhưng điều này dường như không đúng với Hyperbolic. Chúng đã sớm cho thấy sức hút trên thị trường nghiên cứu, thu hút sự quan tâm đáng kể từ các nhà nghiên cứu và nhà phát triển.