Odaily Planet Daily News OpenAI thông báo rằng sản phẩm ChatGPT của họ sẽ trải qua một đợt nâng cấp lớn, bổ sung thêm chức năng tương tác bằng giọng nói và hình ảnh. Giờ đây, người dùng có thể trò chuyện bằng giọng nói với ChatGPT và tìm kiếm bằng hình ảnh.
Tính năng giọng nói được hỗ trợ bởi mô hình chuyển văn bản thành giọng nói mới, tạo ra âm thanh giống con người từ văn bản và giây của lời nói được lấy mẫu. OpenAI cho biết họ đã làm việc với các diễn viên lồng tiếng nổi tiếng để tạo ra 5 giọng nói khác nhau và hệ thống nhận dạng giọng nói Whisper nguồn mở của họ được sử dụng để chuyển lời nói thành văn bản.
Ngoài ra, Spotify, một đối tác ra mắt, đã ra mắt một tính năng mới cho phép người làm podcast dịch chương trình của họ từ tiếng Anh sang các ngôn ngữ khác trong khi vẫn giữ nguyên giọng nói gốc.
Các tính năng mới sẽ bắt đầu được triển khai cho những người đăng ký Plus và Enterprise trả phí trong hai tuần tới. (TechCrunch)