OpenAI는 ChatGPT Plus 및 Teams 사용자를 위한 고급 음성 모드를 출시하여 음성 기능을 강화합니다.
많은 기대를 모으고 있는 이 기능은 챗봇과 사용자의 상호작용을 더욱 자연스러운 대화형 경험으로 바꿔줄 것입니다.
OpenAI의 최신 모델인 GPT-4o로 구동되는 음성 모드는 텍스트, 시각, 오디오를 통합하여 더 빠르고 유연한 교환을 가능하게 합니다.
OpenAI는 공식 트위터를 통해 발표했습니다:
고급 음성은 이번 주 중으로 모든 플러스 및 팀 사용자에게 ChatGPT 앱에 적용될 예정입니다;
또한 50개 이상의 언어로 "늦어서 죄송합니다"라고 말할 수 있다며 이 기능의 재미있는 측면을 강조했는데, 이는 프로젝트의 긴 개발 일정에 대한 고개를 끄덕이게 합니다.
원활한 대화를 위한 한 걸음
OpenAI는 이제 프리미엄 서비스 사용자에게 고급 음성 기능을 제공할 수 있게 되었다고 밝혔습니다.
이러한 혁신을 통해 사용자는 더욱 역동적인 대화에 참여하여 전반적인 대화형 경험을 향상시킬 수 있습니다.
하지만 아직 유럽연합, 아이슬란드, 리히텐슈타인, 노르웨이, 스위스, 영국의 사용자는 이 기능을 사용할 수 없으므로 지리적 격차가 존재합니다.
지난 5월에 처음 발표된 새로운 음성 기능은 2013년 영화 "Her"의 스칼렛 요한슨 목소리와 매우 흡사한 스카이라는 음성 옵션으로 인해 큰 관심을 끌었습니다.
이 폭로 이후 요한슨의 법률 대리인은 OpenAI에 편지를 보내 자신과 유사한 음성을 사용할 권리가 없다고 주장했습니다.
이에 따라 OpenAI는 자사 제품에서 음성 사용을 중단했다고 CNBC가 보도했습니다.
더욱 풍부한 음성 경험
최초 발표 이후 몇 달 동안 사용자들은 무료 티어에서 다양한 음성을 사용하여 ChatGPT와 상호작용할 수 있었습니다.
그러나 고급 버전은 응답성이 크게 향상되어 대화 도중에 방해를 받으면 일시 중지하고 들을 수 있습니다.
현재 사용자는 9가지 음성 중에서 선택할 수 있으며, 앱 설정을 통해 원하는 음성을 맞춤 설정할 수 있습니다.
"기다릴 만한 가치가 있었다고 생각하시길 바랍니다."라고 OpenAI의 공동 창립자이자 CEO인 샘 알트먼은 X에 올린 게시물에서 이 기능에 대한 기대감을 반영했습니다.
경쟁이 치열해지면서 OpenAI는 빠르게 진화하는 제너레이티브 AI의 환경에 처해 있습니다.
구글은 최근 안드로이드 디바이스에 제미니 라이브 음성 기능을 출시했으며, 메타는 페이스북과 인스타그램을 포함한 자사 플랫폼을 통해 유명인의 음성을 공개할 예정입니다.
새 기능 탐색하기
OpenAI의 고급 음성 모드는 플러스, 팀 또는 엔터프라이즈 요금제 가입자에게만 제공되며, 플러스 요금제는 월 $20부터 시작합니다.
이 새로운 기능에 액세스하려면 사용자는 디바이스에 최신 버전의 ChatGPT 앱이 설치되어 있는지 확인해야 합니다.
액세스 권한이 부여되면 앱 내에 알림이 표시되어 사용자에게 계속 진행하라는 메시지가 표시됩니다.
음성 채팅을 시작하려면 오른쪽으로 스와이프하거나 앱의 왼쪽 상단에 있는 두 줄 아이콘을 탭하여 새 채팅을 만들 수 있습니다.
메시지 텍스트 필드와 마이크 아이콘 옆에 음파 아이콘이 표시되어 음성 기능이 준비되었음을 나타냅니다.
아이콘을 탭하면 준비 상태를 알리는 짧은 '삑' 소리가 나면서 화면의 원이 파란색과 흰색의 역동적인 애니메이션으로 바뀝니다.
사용자는 말을 시작할 수 있으며 즉각적인 응답을 기대할 수 있습니다.
OpenAI는 다양한 외국어 억양을 개선하고 대화 속도를 향상시키는 데 큰 진전을 이루었습니다.
사용자가 전달 방식에 변화를 원할 경우, ChatGPT에 음성 속도를 높이거나 남부 억양을 채택하도록 요청하는 등 수정을 요청할 수 있습니다.
제한 사항 및 사용 사례
고급 음성 모드를 통해 ChatGPT는 동화 구연부터 면접 준비, 외국어 실력 연습까지 다양한 작업을 지원합니다.
그러나 유료 구독자라도 사용량 제한이 적용된다는 점에 유의해야 합니다.
약 30분이 지나면 화면 하단에 '15분 남았습니다'라는 알림이 표시되어 이 기능의 사용 가능 범위에 대한 의문이 생깁니다.
OpenAI가 지속적으로 혁신하고 기능을 확장함에 따라 고급 음성 모드의 도입은 AI 상호작용을 더욱 매력적이고 생생하게 만드는 데 중요한 단계가 될 것입니다.