Song Tử 2.0 - Một mô hình cho “Mọi thứ”
Google ra mắt Gemini 2.0, một mô hình AI thử nghiệm được coi là bước tiến mang tính chuyển đổi hướng tới một "trợ lý vạn năng".
Có khả năng tự động điều hướng các trang web, mô hình này nhằm mục đích trao quyền cho người dùng để phát triển các tác nhân AI tiên tiến.
Tổng giám đốc điều hành Sundar Pichai mô tả đây là sản phẩm có năng lực nhất của Google từ trước đến nay, được thiết kế cho "kỷ nguyên đại lý".
Sự ra mắt này nhấn mạnh cam kết của Google trong việc dẫn đầu cuộc đua AI trong bối cảnh cạnh tranh khốc liệt từ những gã khổng lồ trong ngành nhưSiêu dữ liệu và Microsoft.
Mô hình sẽ được triển khai trên toàn bộ sản phẩm
Pichai thông báo rằng Gemini 2.0, với các tính năng đa phương thức tiên tiến, sẽ sớm được tích hợp vào bộ sản phẩm của công ty, hỗ trợ đầu ra hình ảnh và âm thanh gốc.
Tiếp theo là bản phát hành Gemini 1.0 vào tháng 12 năm 2023, được coi là mô hình "đa phương thức gốc" đầu tiên có khả năng xử lý và phản hồi các truy vấn văn bản, video, hình ảnh, âm thanh và mã.
Phiên bản mới nhất phản ánhGoogle Nỗ lực để duy trì vị trí dẫn đầu trong bối cảnh AI cạnh tranh.
Pichai lưu ý:
“Nếu Gemini 1.0 là về việc sắp xếp và hiểu thông tin thì Gemini 2.0 sẽ là về việc làm cho thông tin hữu ích hơn nhiều.”
Gemini 2.0, ra mắt gần 10 tháng sau mẫu 1.5 trung gian, vẫn đang trong giai đoạn xem trước thử nghiệm.
Hiện tại, chỉ có phiên bản Flash 2.0 nhỏ gọn và tiết kiệm chi phí hơn, chủ yếu dành cho các nhà phát triển và người thử nghiệm.
Demis Hassabis, Giám đốc điều hành của Google DeepMind mô tả lần ra mắt này là một cột mốc quan trọng đối với công ty, mặc dù bản phát hành ban đầu có số lượng hạn chế.
Hassabis giải thích:
“Nó tốt như mẫu Pro hiện tại. Vì vậy, bạn có thể coi nó như một cấp độ hoàn chỉnh tốt hơn, với cùng hiệu quả về chi phí, hiệu quả về hiệu suất và tốc độ. Chúng tôi thực sự hài lòng với điều đó.”
Những người dùng Gemini khác vẫn có thể sử dụng Flash 1.5, được công nhận về tốc độ và hiệu quả.
Không chỉ có Gemini 2.0, Google còn công bố rất nhiều tính năng
Google đã vạch ra kế hoạch đầy tham vọng cho mô hình AI mới nhất của mình, Gemini 2.0, mà Pichai cho biết sẽ cải thiện tính năng Tổng quan về AI hiện đã có sẵn cho một tỷ người dùng.
Pichai lưu ý rằng AI Overviews đang nhanh chóng trở thành một trongcủa Google công cụ tìm kiếm phổ biến nhất.
Với sự tích hợp của Gemini 2.0, tính năng này sẽ có khả năng xử lý các truy vấn phức tạp, nhiều bước, chẳng hạn như giải phương trình toán học và giải quyết các câu hỏi đa phương thức.
Việc thử nghiệm giới hạn cho mô hình này đã bắt đầu vào tuần này, nhưng khả năng lập luận của nó sẽ được mở rộng hơn vào đầu năm sau.
Mô hình hoạt động trênGoogle Chip AI thế hệ thứ 6, Trillium, được ra mắt cùng lúc với thông báo này.
Theo công ty, Trillium cung cấp hiệu suất gấp bốn lần và tiết kiệm năng lượng hơn 67% so với sản phẩm tiền nhiệm.
Khách hàng của Google Cloud hiện có thể sử dụng phần cứng tiên tiến này.
Trong số các tính năng mới được hỗ trợ bởi Gemini 2.0 là "Nghiên cứu sâu", một trợ lý nghiên cứu nâng cao có sẵn trong Gemini Advanced.
Công cụ này tận dụng khả năng lập luận và ngữ cảnh dài để biên soạn các báo cáo nghiên cứu chi tiết.
Giám đốc điều hành Google DeepMind Demis Hassabis nhận xét rằng những tiến bộ này sẽ tạo tiền đề cho một năm 2025 đầy biến đổi:
“Chúng tôi thực sự coi năm 2025 là thời điểm khởi đầu thực sự của kỷ nguyên dựa trên tác nhân.”
Google cũng đã công bố Project Mariner, một tiện ích mở rộng thử nghiệm của Chrome có khả năng tự động điều hướng trình duyệt web và giới thiệu Jules, một tác nhân AI được thiết kế để giúp các nhà phát triển xác định và sửa lỗi mã hóa.
Một tính năng khác do Gemini cung cấp, được Hassabis mô tả là một "trứng Phục sinh", là trợ lý chơi game có khả năng phân tích màn hình của người dùng và cải thiện lối chơi—một minh chứng cho khả năng đa phương thức thực sự của mô hình này.