OpenAI đã thông báo bắt đầu triển khai chế độ giọng nói nâng cao cho một nhóm nhỏ người dùng ChatGPT Plus. Chế độ này mang đến cuộc trò chuyện theo thời gian thực tự nhiên hơn, cho phép ngắt quãng bất kỳ lúc nào và có thể cảm nhận cũng như phản hồi cảm xúc của người dùng. Người dùng tham gia thử nghiệm này sẽ nhận được hướng dẫn qua email và ứng dụng di động. OpenAI có kế hoạch dần dần cung cấp chế độ giọng nói nâng cao cho tất cả người dùng Plus vào mùa thu. Tính năng chia sẻ video và màn hình sẽ được triển khai sau.
Sau khi ra mắt chế độ giọng nói nâng cao, OpenAI cho biết họ đã tăng cường tính bảo mật và chất lượng của các cuộc trò chuyện bằng giọng nói để đưa công nghệ tiên tiến này đến với hàng triệu người. OpenAI đã kiểm tra khả năng nói của GPT-4o với hơn 100 người kiểm tra bên ngoài bao gồm 45 ngôn ngữ. Để bảo vệ quyền riêng tư, mô hình sẽ chỉ sử dụng bốn giọng nói đặt trước và đã thiết lập một hệ thống để chặn các đầu ra giọng nói khác, đồng thời thực hiện các biện pháp bảo vệ để ngăn chặn bạo lực hoặc nội dung có bản quyền.
OpenAI cho biết họ sẽ học hỏi từ thử nghiệm này để giúp trải nghiệm giọng nói nâng cao an toàn và thú vị hơn, đồng thời có kế hoạch chia sẻ báo cáo chi tiết về khả năng, hạn chế và đánh giá bảo mật của GPT-4o vào đầu tháng 8.