Nguồn: Whip Bullsman
Theo tin tức ngày 14 tháng 5, ChatGPT sắp trở nên hữu ích hơn.
OpenAI đã công bố vào hôm thứ Hai mô hình ngôn ngữ lớn trí tuệ nhân tạo mới nhất của họ, mô hình này cho biết sẽ giúp ChatGPT thông minh hơn và dễ sử dụng hơn.
Mẫu mới có tên GPT-4o, là phiên bản cập nhật của mẫu GPT-4 thế hệ trước mà công ty đã ra mắt hơn một năm trước. Mô hình này sẽ mở cửa cho khách hàng miễn phí, nghĩa là bất kỳ ai cũng có thể truy cập công nghệ tiên tiến của OpenAI thông qua ChatGPT.
GPT-4o sẽ biến ChatGPT thành trợ lý cá nhân kỹ thuật số một cách hiệu quả có thể thực hiện các cuộc trò chuyện bằng giọng nói trong thời gian thực, theo bản demo của công ty vào thứ Hai. Nó cũng có thể tương tác bằng văn bản và hình ảnh, nghĩa là nó có thể xem ảnh chụp màn hình, ảnh, tài liệu hoặc sơ đồ do người dùng tải lên và tổ chức các cuộc trò chuyện về chúng.
OpenAI CTO Mira Murati cho biết phiên bản cập nhật của ChatGPT giờ đây cũng sẽ có khả năng ghi nhớ, nghĩa là nó có thể học hỏi từ các cuộc trò chuyện trước đó với người dùng và có thể dịch theo thời gian thực.
“Đây là lần đầu tiên chúng tôi thực sự đạt được một bước tiến lớn về tính dễ sử dụng,” Mulati cho biết trong buổi trình diễn trực tiếp tại trụ sở chính của công ty ở San Francisco. "Sự tương tác này trở nên tự nhiên và dễ dàng hơn."
p>
Bản phát hành mới ra mắt khi OpenAI tìm cách đi trước cuộc chạy đua vũ trang trí tuệ nhân tạo đang ngày càng gia tăng. Các đối thủ cạnh tranh bao gồm Google và Meta đang nỗ lực xây dựng các mô hình ngôn ngữ quy mô lớn ngày càng mạnh mẽ để hỗ trợ chatbot và có thể được sử dụng để đưa công nghệ trí tuệ nhân tạo vào nhiều loại sản phẩm khác.
Sự kiện OpenAI diễn ra một ngày trước hội nghị nhà phát triển I/O thường niên của Google, nơi Google dự kiến sẽ công bố các bản cập nhật cho mô hình Gemini AI của mình.
Giống như GPT-4o mới, Gemini của Google là đa phương thức, nghĩa là nó có thể diễn giải và tạo văn bản, hình ảnh và âm thanh.
Bản cập nhật của OpenAI cũng đi trước các thông báo về AI dự kiến tại Hội nghị các nhà phát triển toàn cầu của Apple vào tháng tới, trong đó có thể bao gồm những cách mới để kết hợp AI vào phiên bản iPhone hoặc iOS tiếp theo.
Trong khi đó, phiên bản GPT mới nhất có thể là một lợi ích cho Microsoft, hãng đã đầu tư hàng tỷ đô la vào OpenAI để nhúng công nghệ trí tuệ nhân tạo vào các sản phẩm của riêng mình.
Các nhà điều hành OpenAI đã trình diễn các cuộc trò chuyện bằng giọng nói với ChatGPT để nhận được hướng dẫn theo thời gian thực về cách giải các bài toán, kể chuyện trước khi đi ngủ và nhận lời khuyên về mã hóa.
ChatGPT có thể nói bằng giọng tự nhiên, giống giọng con người cũng như giọng robot và thậm chí có thể hát một số câu trả lời của nó. Công cụ này cũng cung cấp khả năng xem hình ảnh biểu đồ và thảo luận về chúng.
Họ cũng trình diễn một mô hình có thể phát hiện cảm xúc của người dùng; tại một thời điểm, nó nghe thấy tiếng thở của giám đốc điều hành và khuyến khích anh ta bình tĩnh lại.
"Bạn không phải là máy hút bụi!" Giọng nữ của ChatGPT (nghe rất giống với người bạn đồng hành kỹ thuật số do Scarlett Johansson lồng tiếng trong bộ phim Her năm 2013) nói đùa với nhân viên.
ChatGPT cũng có thể tiến hành các cuộc trò chuyện bằng nhiều ngôn ngữ với tính năng dịch và phản hồi tự động. Theo OpenAI, công cụ này hiện hỗ trợ hơn 50 ngôn ngữ.
“Chế độ thoại (và video) mới là giao diện máy tính tốt nhất mà tôi từng sử dụng.” Giám đốc điều hành OpenAI Sam Altman cho biết trong một bài đăng trên blog sau thông báo. "Cảm giác giống như AI trong phim; tôi vẫn hơi ngạc nhiên vì nó có thật. Hóa ra việc đạt được thời gian phản hồi và khả năng biểu cảm ở cấp độ con người là một thay đổi lớn." Murati cho biết OpenAI sẽ ra mắt ứng dụng máy tính để bàn ChatGPT với GPT-4o. chức năng cung cấp cho người dùng một nền tảng khác để tương tác với công nghệ của công ty.
GPT-4o cũng sẽ có sẵn cho các nhà phát triển muốn xây dựng chatbot tùy chỉnh của riêng họ từ cửa hàng GPT của OpenAI, một tính năng hiện có sẵn cho cả người dùng không trả tiền.
Các công nghệ và tính năng cập nhật sẽ được triển khai cho ChatGPT trong những tháng tới. Người dùng ChatGPT miễn phí sẽ tương tác với mô hình GPT-4o mới với số lần giới hạn trước khi công cụ này tự động chuyển sang mô hình GPT-3.5 cũ hơn; người dùng trả phí sẽ có quyền truy cập vào số lượng tin nhắn lớn hơn bằng cách sử dụng mô hình mới nhất.
OpenAI CTO Mira Murati cho biết trong buổi phát trực tiếp cập nhật mùa xuân của công ty ngày hôm nay rằng OpenAI đang cung cấp nhiều tính năng trước đây chỉ đăng ký cho người dùng ChatGPT miễn phí, tính năng lớn nhất trong số đó là duyệt qua cửa hàng GPT và sử dụng Khả năng tùy chỉnh bot của bạn.
Công ty cũng đăng bản cập nhật ngày hôm nay trên một blog trên trang web của mình.
Chỉ bốn tháng trước, vào ngày 10 tháng 1, công ty đã mở cửa hàng GPT cho những người đăng ký trả phí. Cửa hàng cho phép người đăng ký ChatGPT Plus tạo chatbot của riêng họ (được gọi là GPT) và chia sẻ chúng. Một số bot phổ biến hiện nay bao gồm bot tạo hình ảnh, chatbot có tên Consensus được thiết kế để hỗ trợ nghiên cứu khoa học và bot tạo logo.
OpenAI Họ cho biết họ sẽ cung cấp cho các nhà xây dựng GPT một chương trình chia sẻ doanh thu dựa trên sự tham gia, chương trình này đã bắt đầu thử nghiệm vào tháng 3. Nhưng vì tính năng này chỉ giới hạn ở những người dùng ChatGPT trả phí nên đối tượng của bot cũng bị hạn chế.
OpenAI cũng cho phép người dùng miễn phí tải lên các tệp và ảnh để tóm tắt và phân tích, tìm kiếm trên web bằng ChatGPT và lưu trữ các cuộc trò chuyện trước đó bằng GPT-4, tất cả đều đã bị khóa đăng ký trước đó.
OpenAI cho biết hơn 100 triệu người đang sử dụng ChatGPT.
Tuy nhiên, trải nghiệm ChatGPT được cập nhật — và khả năng tương tác với nó thông qua các cuộc trò chuyện bằng giọng nói được cải thiện trên máy tính để bàn — có thể mang lại cho nhiều người lý do hơn để sử dụng công nghệ của nó.
Động thái này diễn ra khi Google và Meta tích hợp trí tuệ nhân tạo vào các sản phẩm tiêu dùng được sử dụng rộng rãi hơn như Instagram và Google Assistant, có khả năng giúp công nghệ của các công ty này trở nên phổ biến rộng rãi hơn và dễ sử dụng hơn.