7월 18일, 미국(미국)에 본사를 둔 인공지능(AI) 회사OpenAI는 블로그 게시물에서 다음과 같이 발표했습니다. 라는 새롭고 비용 효율적인 제너레이티브 AI 모델인 'GPT-4o mini'를 출시했습니다;
이 축소된 버전은 더 많은 기업과 프로그램이 고급 AI 기능을 활용할 수 있도록 설계되었습니다.
GPT-4o 미니 소개
GPT-4o 미니 모델의 지식은 작년 10월에 마지막으로 업데이트되어 언어 유형이 GPT-4o와 일치하고 128,000개의 토큰으로 구성된 컨텍스트 창이 특징입니다.
이 새로운 모델은 이전 모델과 동일한 기능을 다수 지원하며, 현재 API를 통해 텍스트 및 시각적 모달리티를 제공하고 있으며 향후 비디오 및 오디오 입출력까지 확장할 계획입니다.
정확한 매개변수 규모는 공개되지 않았습니다,OpenAI의 공식 블로그 게시물 상태입니다:
"현재로서는 가장 경제적이고 비용 효율적인 소형 모델이며 곧 미세 조정이 이루어질 예정입니다."
놀랍게도 GPT-4o mini는 LMSYS 순위에서 채팅 선호도 면에서 GPT-4를 능가하고 전체 순위에서는 GPT-4 터보와 비슷한 성능을 보였습니다.
출시 전에는 6,000명 이상의 사용자가 초기 버전인 'upcoming-gpt-mini'에 투표했지만, 그 결과는 이후 삭제되었습니다.
LMSYS는 X에서 다시 투표를 진행하고 있으며 곧 공식 모델에 대한 결과를 공개할 예정이라고 발표했습니다.
GPT-4o mini의 출시로 AI 애플리케이션의 범위가 크게 확대될 예정입니다.
비용이 저렴하고 지연 시간이 짧을 뿐만 아니라 여러 모델을 연결하거나 병렬화하거나(여러 API 호출), 모델에 광범위한 컨텍스트를 전달하거나(전체 코드 베이스 또는 대화 기록 등), 신속한 실시간 문자 응답을 통해 고객과 상호작용하는 애플리케이션(챗봇 지원) 등 다양한 작업을 지원합니다.
또한 GPT-4o와 공유되는 개선된 토큰화기 덕분에 영어 이외의 텍스트를 보다 비용 효율적으로 처리할 수 있습니다.
텍스트 인텔리전스 및 다중 모드 추론 측면에서 GPT-4o mini는 GPT-3.5 Turbo 및 기타 소형 모델을 능가하며 GPT-4o가 수행하는 모든 언어를 지원합니다.
또한 GPT-3.5 터보에 비해 향상된 긴 컨텍스트 처리 성능을 보여주며 함수 호출에서 우수한 성능을 발휘하여 개발자가 애플리케이션을 더욱 편리하게 빌드할 수 있습니다.
미니 모델이 다른 모델에 비해 환경적 이점을 제공하는지 여부는 아직 명확하지 않습니다.
OpenAI는 운영 비용 절감에 사용된 방법론에 대한 정보를 제공하지 않았으며, 이는 이점이 실제 에너지 절감으로 확대되지 않고 최종 사용자 비용 절감에 적용될 수 있음을 시사합니다.
OpenAI에 따르면 전력과 성능 간의 트레이드오프는 미미합니다.
에너지 소비 공간은 더 작지만 GPT mini의 성능은 부족하지 않습니다.
OpenAI의 블로그 게시물에 따르면 새 모델은 이전 프론티어 모델보다 '훨씬 더 저렴하고', GPT-3.5 터보보다 '60% 이상 저렴하다'고 합니다;
회사는 이렇게 씁니다:
"GPT-4o mini는 텍스트 지능과 다중 모드 추론 모두에서 학술 벤치마크에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가하며 GPT-4o와 동일한 범위의 언어를 지원합니다."
GPT-4o mini의 가격은 1M 토큰 입력당 15센트, 1M 토큰 출력당 60센트입니다.
1백만 토큰은 대략 2,500페이지 분량의 책 한 권과 맞먹습니다.
이 모델은 Llama 3 8B에 이어 가장 저렴한 고성능 모델로 자리매김하고 있습니다.
아래 표에서 볼 수 있듯이 현재 주요 제조업체에서 출시한 모든 소형 모델 중에서 GPT-4o mini는 Gemini 1.5 플래시, Llama 3 8B 및 Mistral 7B와 같은 많은 경쟁 제품을 능가하여 가장 비용 효율적인 옵션입니다.
새 모델을 담당하고 있는 OpenAI의 제품 매니저인 고덴먼트는 이렇게 말합니다:
"OpenAI의 핵심은 AI를 안전하게 구축하고 배포하여 폭넓게 액세스할 수 있도록 하는 것입니다. 더 낮은 비용으로 인텔리전스를 제공하는 것은 이를 위한 가장 효율적인 방법 중 하나입니다."
고덴먼트는 OpenAI가 모델 아키텍처를 개선하고 학습 데이터와 요법을 개선하여 더 저렴한 제품을 개발했다고 설명했습니다.
그는 GPT-4o mini가 여러 일반적인 벤치마크에서 시중의 다른 '소형' 모델보다 성능이 뛰어나다고 말했습니다.
그는 GPT-4o mini가 AI를 더 널리 보급하려는 OpenAI의 사명을 진정으로 구현하고 있다고 거듭 강조했습니다. AI가 전 세계 모든 곳, 모든 산업, 모든 애플리케이션에 혜택을 주려면 더 저렴한 가격으로 제공되어야 합니다.
그는 반복했습니다:
"GPT-4o mini는 사람들이 AI에 더 폭넓게 접근할 수 있도록 한다는 OpenAI의 사명을 진정으로 실현하는 제품이라고 생각합니다. AI가 전 세계 모든 곳, 모든 산업, 모든 애플리케이션에 혜택을 주려면 AI를 더 저렴하게 만들어야 합니다."
그는 고객의 요구가 진화하고 있음을 인정합니다:
"시장에서 점점 더 많은 개발자와 기업이 소규모 및 대규모 모델을 결합하여 자신에게 적합한 가격과 지연 시간으로 최고의 제품 경험을 구축하는 것을 목격하고 있습니다."
고덴먼트는 OpenAI의 클라우드 서비스는 경쟁사보다 더 많은 보안 테스트를 거친 모델을 고객에게 제공한다고 말합니다. 그는 OpenAI가 궁극적으로 고객이 자신의 디바이스에서 실행할 수 있는 모델을 개발할 수 있다고 덧붙입니다.
그는 결론을 내렸습니다:
"엄청난 수요를 확인하면 그 문을 열 수도 있습니다."
GPT-4o 미니가 애플의 아이폰SE와 비슷하다고요?
GPT-4o mini는 OpenAI의 주력 제품인 ChatGPT의 비용 효율적인 버전입니다.
아이폰 3G부터 최신 아이폰 15 프로 맥스에 이르기까지 애플이 아이폰을 자주 출시하는 것과 유사하게 OpenAI도 ChatGPT와 비슷한 전략을 채택하고 있는 것으로 보입니다.
아이폰의 점진적 업데이트에 대한 일부 비판처럼, OpenAI의 접근 방식이 최소한의 업그레이드만 제공하면서 상당한 가격 인상으로 이어지지 않을지, 아니면 수준 이하의 업그레이드를 제공하게 될지 적절한 질문이 제기됩니다.
경쟁 속에서도 꾸준히 새로운 기능을 도입하는 OpenAI
GPT-4o mini의 출시는 OpenAI의 활발한 활동과 회사를 향한 다양한 활동과 맞물려 있습니다.
OpenAI는 '스트로베리'라는 이름의 AI 모델을 개발 중이며, 이 모델은 GPT-4o를 뛰어넘는 고급 추론 능력을 발휘하여 보다 인간과 유사한 응답을 제공할 것으로 기대되고 있습니다.
이 새로운 모델은 회사의 수수께끼 같은 Q* 프로젝트의 연장선상에 있다는 소문이 있습니다.
한편, 내부 고발자가 회사의 기밀유지계약서 사용과 관련된 잠재적 위법 행위에 대한 조사를 요청함에 따라 OpenAI는 미국 증권거래위원회(SEC)의 조사를 받게 될 수도 있습니다.
OpenAI는 AI를 '가능한 한 폭넓게 이용할 수 있게 하려는 노력의 일환'이라고 설명했지만, 이는 AI 클라우드 제공업체 간의 경쟁이 심화되고 소규모의 무료 오픈소스 AI 모델에 대한 관심이 급증하고 있다는 점을 강조하는 것이기도 합니다.
여러 소식통에 따르면 메타는 7월 23일에 4,000억 개의 파라미터를 자랑하는 가장 큰 버전의 라마 3를 공개할 계획이며, 출시일은 변경될 수 있다고 합니다.
이 버전의 Llama 3의 기능은 아직 명확하지 않지만 일부 기업에서는 비용 효율성, 사용자 지정 기능, 모델과 처리하는 데이터 모두에 대한 더 큰 제어 기능으로 인해 오픈 소스 AI 모델에 매력을 느끼고 있습니다.