Liệu SLM có phải là công cụ thay đổi cuộc chơi AI tiếp theo không?
Trong khiNgành công nghiệp AI vẫn tập trung nhiều vào Mô hình ngôn ngữ lớn (LLM), một nhóm chuyên gia ngày càng đông đảo tin rằng Mô hình ngôn ngữ nhỏ (SLM) có thể sớm trở thành tâm điểm chú ý.
Khi các công ty công nghệ tăng cường đầu tư vàoAI tạo ra trong mùa lễ hội nhộn nhịp, cuộc trò chuyện đang chuyển sang nhu cầu về các giải pháp phù hợp hơn là các hệ thống đơn khối.
Mặc dù LLM có khả năng xử lý nhiều nhiệm vụ khác nhau nhưng chúng thường tốn nhiều tài nguyên, gây ra thách thức về chi phí, mức tiêu thụ năng lượng và nhu cầu tính toán.
Theo Giám đốc điều hành AWS Matt Garman, hiện đã có sự quan tâm đáng kể từ các doanh nghiệp tận dụng AI tạo sinh được hỗ trợ bởi các mô hình như Anthropic.
Tuy nhiên, LLM, mặc dù chiếm ưu thế ở một số lĩnh vực, nhưng lại không phù hợp với mọi nơi.
Tổng giám đốc điều hành Teradata Steven McMillan ủng hộ SLM nhưtương lai của AI, nhấn mạnh khả năng cung cấp kết quả cụ thể cho từng nhiệm vụ.
McMillan bày tỏ:
“Khi nhìn về tương lai, chúng tôi nghĩ rằng các mô hình ngôn ngữ vừa và nhỏ cùng các môi trường được kiểm soát như LLM theo lĩnh vực cụ thể sẽ cung cấp các giải pháp tốt hơn nhiều.”
SLM được xây dựng có mục đích, được đào tạo trên các tập dữ liệu cụ thể để cung cấp thông tin chi tiết có liên quan cao đồng thời đảm bảo quyền riêng tư dữ liệu.
Không giống như các đối tác lớn hơn, chúng tối ưu hóa năng lượng và tài nguyên máy tính để mở rộng theo nhu cầu của dự án, cung cấp giải pháp thay thế hiệu quả và tiết kiệm chi phí.
Đối với các doanh nghiệp yêu cầu chuyên môn sâu trong một lĩnh vực cụ thể, các mô hình chuyên biệt—cho dù là LLM hay SLM chuyên ngành—mang lại độ chính xác vô song. Ví dụ, một mô hình được thiết kế riêng cho Giám đốc tiếp thị (CMO) so với mô hình dành cho Giám đốc tài chính (CFO) mang lại những hiểu biết sâu sắc có liên quan và theo ngữ cảnh cao trong lĩnh vực đào tạo của nó.
Khi bối cảnh AI phát triển, sự gia tăng của SLM làm nổi bật nhu cầu ngày càng tăng về độ chính xác, hiệu quả và khả năng mở rộng - những phẩm chất có thể định hình lại tương lai của các hệ thống thông minh.
SLM có phải là lựa chọn tốt hơn không?
Hiệp hội các nhà khoa học dữ liệu (ADaSci) ước tính rằng việc phát triển một SLM với 7 tỷ tham số để phục vụ một triệu người dùng sẽ chỉ cần 55,1 MWh (megawatt giờ) điện.
Ngược lại, đào tạoGPT-3 , với 175 tỷ tham số, đã tiêu thụ một con số khổng lồ là 1.287 MWh, chưa tính đến năng lượng được sử dụng khi mô hình được triển khai tích cực.
Điều này có nghĩa là một SLM chỉ sử dụng khoảng 5% năng lượng mà một LLM cần.
Do nhu cầu tính toán khổng lồ, LLM thường được chạy trên máy chủ đám mây, điều này thường có nghĩa là các công ty mất quyền kiểm soát dữ liệu của mình và phải đối mặt với thời gian phản hồi chậm hơn khi thông tin truyền qua Internet.
Khi các doanh nghiệp ngày càng áp dụngAI, rõ ràng là không có một giải pháp chung nào phù hợp với tất cả.
Các công ty sẽ ưu tiên hiệu quả, tiết kiệm chi phí và giảm thiểu việc truyền dữ liệu lên đám mây bằng cách chọn mô hình phù hợp nhất cho từng dự án, có thể là LLM mục đích chung hoặc mô hình nhỏ hơn, chuyên biệt hơn.
Trong bối cảnh thay đổi này, hiệu quả và độ chính xác sẽ là tối quan trọng.
McMillan nói:
“Khi bạn nghĩ đến việc đào tạo các mô hình AI, chúng phải được xây dựng trên nền tảng dữ liệu tuyệt vời.”
Ông nói thêm:
“Đó chính là mục tiêu của chúng tôi, cung cấp bộ dữ liệu đáng tin cậy và sau đó cung cấp các khả năng và khả năng phân tích để khách hàng và khách hàng của họ có thể tin tưởng vào kết quả đầu ra.”
Các LLM nhỏ hơn, dành riêng cho từng lĩnh vực cung cấp một giải pháp thay thế hấp dẫn, cho phép các doanh nghiệp khai thácsức mạnh của AI không cần chi phí tài nguyên lớn và phức tạp như các mô hình lớn hơn.
Khi AI trở thành yếu tố trung tâm trong việc ra quyết định kinh doanh, việc lựa chọn mô hình phù hợp cho từng nhiệm vụ sẽ rất quan trọng, đảm bảo kết quả đáng tin cậy và có thể mở rộng.