저자: Carl Franzen, Deep Tide TechFlow에서 편집
단 며칠 전까지만 해도 가장 전문적인 괴짜들(그리고 그들 중 한 사람으로서 이렇게 말하겠습니다)만이 DeepSeek에 대해 들어본 적이 있었습니다. 2015년에 설립된 정량적 분석 회사인 하이플라이어 캐피털 매니지먼트의 자회사인 중국 AI 회사입니다. 하지만 지난 며칠 동안 실리콘밸리에서 가장 화제가 된 회사가 되었습니다.
이것은 OpenAI의 현재 최고 모델인 o1과 유사한 '추론'이 가능한 새로운 대규모 언어 모델(LLM)인 DeepSeek-R1을 출시했기 때문입니다. -- 어려운 질문에 답하고 복잡한 문제를 해결하기 위해 단계별 또는 "사고 체인" 접근 방식으로 자체 분석을 반영하는 데 몇 초 또는 몇 분이 걸립니다.
그뿐만 아니라 DeepSeek-R1은 다양한 주제에 대한 질문에 답하는 AI의 성능을 측정하는 다양한 타사 벤치마크에서 OpenAI의 o1과 비슷하거나 더 나은 점수를 받았을 뿐만 아니라, 훈련 비용이 약 500만 달러에 불과하고 훨씬 적은 수의 GPU를 사용하는 것으로 알려졌습니다. GPU)는 OpenAI의 본거지인 미국에서 엄격하게 금지된 금액보다 훨씬 적습니다.
하지만 유료 ChatGPT Plus 구독자(월 20달러)와 그 이상의 구독자(예: 프로 레벨의 경우 월 200달러)만 사용할 수 있었던 o1과 달리, DeepSeek-R1은 완전한 오픈소스 모델로 출시되었기 때문에 빠르게 AI 사다리를 올라갈 수 있었습니다. AI 코드 공유 커뮤니티 Hugging Face에서 가장 인기 있고 활동적인 모델 목록의 최상위에 빠르게 오른 이유입니다.
그리고 완전한 오픈 소스이기 때문에 사람들은 모바일 기기에서 실행할 수 있을 정도로 작게 만들거나 다른 오픈 소스 모델과 함께 사용하는 등 다양한 방식으로 모델을 미세 조정하고 훈련하여 여러 특정 작업에 맞게 조정해 왔습니다. 개발 목적으로 사용하려는 경우에도 DeepSeek의 API 비용은 OpenAI의 동급 모델인 o1 모델보다 90% 이상 저렴합니다.
가장 인상적인 점은 소프트웨어 엔지니어가 아니어도 사용할 수 있다는 점입니다. DeepSeek는 미국 사용자를 위한 무료 웹사이트와 모바일 앱을 제공하며, R1 기반 챗봇 인터페이스는 OpenAI의 ChatGPT와 매우 유사합니다. 그러나 DeepSeek는 이 강력한 추론 모델을 웹 검색에 연결함으로써 OpenAI를 다시 한 번 능가합니다(웹 검색은 현재 덜 강력한 GPT 모델군에서만 사용할 수 있습니다).
명백한 아이러니
대중을 위한 AI 민주화라는 OpenAI의 원래 목표를 생각하면 다소 흥미롭거나 혼란스러운 아이러니가 있습니다. Nvidia의 수석 리서치 매니저인 Jim Fan은 X에 대해 "우리는 미국 이외의 회사가 모든 사람에게 권한을 부여하는 진정한 개방형 첨단 연구라는 OpenAI의 원래 사명을 지속하고 있는 시대에 살고 있습니다. 말이 안 되죠. 하지만 가장 흥미로운 결과는 종종 가장 가능성이 높습니다."
또 한 번, X 사용자 @SuspendedRobot은 (ChatGPT에서 생성된 Q&A 결과와 기타 데이터로 학습된 것으로 보인다는 보고서를 인용하며) "OpenAI는 전체 인터넷에서 데이터를 훔쳐서 스스로 더 풍부하게 만들고, DeepSeek는 이를 훔쳐서 대중에게 무료로 돌려주는데, 이는 마치 영국 민화를 떠올리게 합니다."라고 말했습니다.
오픈소스 라마가 뒤처지면서 위기에 처한 메타?
하지만 딥시크의 성공을 눈여겨본 것은 팬뿐만이 아니었습니다. 다양한 엔지니어, 사상가, 리더들과 대화하고 기사를 읽은 결과, 딥시크-R1의 오픈소스 공개, 고성능 성능, 그리고 기존 세대 AI 리더들에게 '갑자기' 도전장을 내밀었다는 사실은 실리콘 밸리를 비롯한 전 세계에 충격파를 불러일으켰습니다. 제 과장된 제목에서 알 수 있듯이 '모든 사람'이 열광하는 것은 아니더라도 적어도 기술 및 비즈니스 업계에서는 뜨거운 화제입니다.
실리콘밸리의 익명 가십 공유 앱인 Blind에 올라온 한 메시지는 라마 모델로 오픈소스 AI의 왕이 되려는 메타의 노력을 단숨에 앞지른 딥시크의 성공으로 인해 메타가 위기에 빠졌다는 내용을 담고 있어 화제가 되고 있습니다.

"이것은 전체 판도를 바꿉니다. 이것은 게임 전체를 바꾼다"
X 사용자 @tphuang은 다음과 같이 설득력 있는 지적을 했습니다."DeepSeek는 정상을 넘어 AI를 상품화했습니다. 첫 번째 이미지가 제 눈을 뜨게 했습니다. r1은 미국보다 인건비가 훨씬 낮기 때문에 향후 5년 안에 많은 일자리가 자동화로 대체될 것입니다."라고 말했습니다. 이어서 그는 딥시크의 R1이 OpenAI의 o1보다 사용자에게 더 매력적인 이유를 다음과 같이 설명했습니다."o1에는 세 가지 큰 문제가 있습니다.
1) 너무 느립니다.
2) 너무 비싸다
3) 최종 사용자 제어 부족/오픈AI에 대한 과의존성
R1은 이러한 문제를 모두 해결합니다. 기업들은 추가 비용이나 느리거나 응답이 없는 OpenAI 서버에 대한 걱정 없이 자체 Nvidia GPU를 구매하여 이러한 모델을 실행할 수 있습니다."
@tphaung은 또한 "DeepSeek가 LLM의 안드로이드가 될까요?"라는 흥미로운 비유를 제시하기도 했습니다.
사이버 기업가인 아르노 베르트랑은 X에서 딥시크의 성공이 미친 엄청난 영향에 대해 솔직하게 말했습니다: "딥시크가 업계 전체의 판도를 바꾼 것은 아무리 강조해도 지나치지 않습니다. AI뿐 아니라 중국의 기술 개발을 막으려는 미국의 잘못된 시도가 없었다면 딥시크는 탄생하지 못했을지도 모릅니다(필요는 발명의 어머니라는 속담이 있듯이)."
검열 문제
그러나 다른 사람들은 중국에서 활동하는 스타트업으로서 중국의 법률과 콘텐츠 검열 요건을 준수해야 한다고 주장하며 DeepSeek의 급부상에 대해 경고하고 있습니다. 실제로 제가 개인적으로 미국에서 iOS용 DeepSeek를 사용했을 때 특정 질문에 대한 답변을 얻지 못했습니다.
뉴스 미디어의 일원으로서 저는 당연히 언론과 표현의 자유를 소중히 여기며, 이는 제가 확고하게 지지하는 가장 기본적인 개념 중 하나입니다.
그러나, 저는 또한 OpenAI의 모델과 제품(ChatGPT 포함)이 다양한 질문, 특히 인간의 성 및 성인/NSFW 콘텐츠와 관련된 질문에 대한 답변을 거부한다는 점을 지적하지 않을 수 없습니다. 이러한 질문은 일반적인 질문입니다.
물론 이는 완전히 상호적인 비교는 아닙니다. 일부 사용자들은 외국 기술에 의존하는 것에 대한 거부감 때문에 딥시크의 궁극적인 가치와 유용성에 회의적일 수 있습니다. 하지만 성능과 저렴한 비용은 부인할 수 없는 사실입니다.
미국이 전체 상품의 16.5%를 중국에서 수입하는 시대에, 특히 모델 코드를 무료로 다운로드하여 오프라인에서 안전한 환경의 디바이스에서 사용할 수 있는 상황에서 검열 우려나 보안 위험만을 이유로 DeepSeek-R1 사용을 경고하기는 어렵습니다. 사용, 보안 환경의 디바이스에서 실행되며 원하는 대로 미세 조정할 수 있습니다.
딥시크를 둘러싼 활발한 토론에서 '서구의 쇠퇴'와 '중국의 부상'에 대한 실존적 위기의식이 감지됩니다. 일부에서는 이미 미국 사용자들이 틱톡이 잠시 금지되었을 때 샤오홍슈 앱에 가입하고 그곳에서 공유된 동영상에 나타난 중국의 삶의 질에 놀랐던 것과 연관지어 이야기하고 있으며, 이러한 이야기적 맥락에서 DeepSeek-R1이 등장하게 되었습니다. -중국은 성장하는 것처럼 보였고, 여러 지표에서 미국은 쇠퇴하는 것처럼 보였던(그리고 실제로도 보였던) 맥락에서 말이죠.
세계를 뒤흔들 첫 번째, 그러나 결코 마지막이 아닌 중국 AI 모델
실리콘밸리 대기업의 지배력을 위협하는 마지막 중국 AI 모델도 아닐 것입니다. -OpenAI와 같은 거대 기업들이 범용 인공지능(AGI, 경제적으로 가치 있는 대부분의 업무에서 인간을 능가하는 프로그램) 개발을 위해 그 어느 때보다 많은 자금을 조달하고 있지만 말이죠.
바로 어제, TikTok의 모회사인 ByteDance의 또 다른 중국 모델인 Doubao-1.5-pro가 출시되었으며, 타사 벤치마크에서의 성능은 OpenAI의 비추론 기반인 GPT -4o 모델과 비슷하지만 비용은 1/50 수준입니다.
중국 모델은 매우 빠르고 잘 성장하고 있어 기술 업계 외부의 사람들조차도 주목하고 있습니다: 이코노미스트는 최근 DeepSeek의 성공과 다른 중국 AI 노력에 대한 기사를 게재했습니다. 해설자 Matt Bruenig는 X에 다음과 같이 글을 올렸습니다. "저는 거의 1년 동안 NLRB 문서 요약에 Gemini, ChatGPT, Claude를 사용해 왔습니다. 이 점에서 딥시크가 모든 것을 능가합니다. 챗봇 버전은 무료입니다. 딥시크의 챗봇 버전은 무료이며, 딥시크의 API 사용료는 OpenAI의 API보다 99.5% 저렴합니다. [어깨 으쓱 이모티콘]"
OpenAI는 어떻게 대응하나요?
오픈AI의 공동 창립자이자 CEO인 샘 알트먼(Sam Altman)은 오늘 아직 출시되지 않은 2세대 추론 모델 제품군인 o3를 무료 사용자도 사용할 수 있도록 ChatGPT에 도입한다고 발표했습니다. OpenAI는 여전히 독자적인 고급 모델을 통해 업계 표준을 정립하며 독자적인 길을 개척하고 있는 것으로 보입니다.
그러나 의문은 남습니다. 과연 OpenAI가 새로운 첨단 AI 모델을 만들고 출시하는 데 있어 얼마나 더 앞서나갈 수 있을까요? 그리고 만약 뒤처진다면 그 하락세는 얼마나 빠르고 심할까요?
그러나 OpenAI에는 배울 수 있는 또 다른 역사적 선례가 있습니다. 딥서치와 중국 AI 모델이 실제로 구글의 오픈소스 안드로이드가 모바일에 해당하는 것이라면, 한동안 시장의 상당 부분을 차지했던 애플의 아이폰이 어떻게 폐쇄적이고 독점적인 내부 접근 방식을 통해 고급형 시장을 장악하고, 특히 미국에서 꾸준히 하향세를 보이며 현재 국내 스마트폰 시장 점유율의 60%에 육박할 정도로 점유율을 확대했습니다.
그럼에도 불구하고 유수의 연구소에서 제공하는 AI 모델을 사용하기 위해 큰 비용을 지출하고 있는 모든 사람들에게 딥시크는 동일한 기능을 더 낮은 가격대에 더 많은 제어 기능을 통해 사용할 수 있다고 제안합니다. 엔터프라이즈 환경에서는 이 정도면 충분할 수 있습니다.