앤트로픽, 클로드 3.5 소네트와 하이쿠를 공개합니다: AI 기능의 도약
앤트로픽은 이전 버전에 비해 크게 향상된 최신 AI 모델인 Claude 3.5 Sonnet과 Claude 3.5 Haiku를 출시했습니다.
최초 출시 후 4개월 만에 업데이트된 Claude 3.5 소네트 모델은 이미 리더로 인정받던 코딩 기능에서 한층 더 뛰어난 성능을 발휘합니다.
한편 클로드 3.5 하이쿠는 이전 최고급 모델인 클로드 3 오푸스와 동등한 성능을 제공하면서도 비용 효율성과 효율성을 유지합니다.
클로드 3.5 소네트의 새로운 기능은 무엇인가요?
Claude 3.5 소네트 모델에는 혁신적인 기능이 도입되었습니다: 컴퓨터 사용.
이를 통해 모델은 데스크톱 환경과 상호 작용하여 일반적으로 인간 작업자가 담당하는 작업을 수행할 수 있습니다.
이제 Claude 3.5 Sonnet은 웹 브라우징 기능을 활용하여 데스크톱 수준의 명령을 실행할 수 있습니다.
즉, 사람처럼 소프트웨어 애플리케이션을 조작하고 웹사이트를 활용할 수 있습니다.
Anthropic에 따르면
"초기 고객 피드백에 따르면 업그레이드된 Claude 3.5 Sonnet은 AI 기반 코딩의 중요한 도약이 될 것입니다."
장점은 분명하지만, AI의 자율성에 대한 우려는 여전히 남아 있습니다.
앤트로픽은 사용자가 통제권을 유지할 수 있도록 보장합니다.
사용자는 특정 프롬프트를 통해 작업 실행을 위한 컴퓨터 명령으로 변환되는 클로드의 동작을 안내할 수 있습니다.
특히 업계 벤치마크에서 클라우드는 33.4%에서 49%를 기록하여 SWE 벤치 검증 리더보드에서 49%를 기록하는 등 상당한 개선을 보였습니다.
이 결과로 Claude 3.5 Sonnet은 OpenAI의 최신 제품을 포함한 다른 모델보다 앞서게 되었습니다.
Claude 3.5 하이쿠와 비교하면?
곧 출시될 예정인 Claude 3.5 하이쿠 모델은 기존 하이쿠와 동일한 속도와 가격을 유지하면서 이전 모델인 Claude 3 Opus의 기능에 필적하는 것을 목표로 하고 있습니다.
이 모델은 지연 시간이 짧고 지침을 따르는 기능이 향상된 것이 특징입니다.
특히 구매 내역이나 재고 기록 분석과 같이 방대한 데이터 세트와 빠르게 상호 작용해야 하는 사용자 대면 제품 및 작업에 적합하다고 Anthropic은 설명합니다.
뛰어난 성능을 자랑하는 Claude 3.5 Haiku는 이전 버전에 비해 모든 스킬 세트에서 향상된 성능을 자랑하며 매우 효율적으로 설계되었습니다.
예를 들어, SWE 벤치 검증 리더보드에서 40.6%의 점수를 획득하여 오리지널 Claude 3.5 Sonnet을 비롯한 많은 시판 모델을 능가했습니다.
개발자에게 컴퓨터 사용은 무엇을 의미하나요?
컴퓨터 사용 기능은 AI 상호 작용의 중요한 순간입니다.
이제 Claude 3.5 Sonnet은 스크린샷을 통해 컴퓨터 인터페이스를 '확인'할 수 있어 사용자 인터페이스를 직접 탐색하고 상호작용할 수 있습니다.
개발자는 Claude에게 반복적인 작업을 자동화하도록 지시하여 보다 효율적인 워크플로우를 만들 수 있습니다.
"우리는 클로드가 우리가 제공한 컴퓨터 사용 훈련을 통해 얼마나 빠르게 일반화했는지 놀랐습니다."라고 앤트로픽은 말하며, 사용자 지시를 일련의 논리적 동작으로 변환하는 모델의 능력을 강조했습니다.
이러한 발전에도 불구하고 Anthropic은 이 기술이 아직 실험적이고 불완전하다는 점을 인정합니다.
클로드는 스크롤 및 확대/축소와 같은 기본적인 작업에 어려움을 겪을 수 있으므로 사용자는 주의를 기울여야 합니다.
개발팀의 일화는 이 모델의 단점을 잘 보여줍니다. 예를 들어, 긴 화면 녹화를 중지하기 위해 클릭한 적이 있는데, 그 결과 영상이 손실된 적이 있습니다.
안전 조치 및 윤리적 고려 사항
이러한 강력한 기능의 도입으로 오용 가능성에 대한 의문도 제기되고 있습니다.
앤트로픽은 컴퓨터 사용 기능의 유해한 사용을 감지하기 위해 새로운 분류기와 안전장치를 개발했습니다.
Facebook은 스팸, 잘못된 정보 또는 사기 행위에 악용될 수 있다는 점을 지적하며 기술의 윤리적 영향에 대해 경계를 늦추지 않고 있습니다.
Claude 3.5 Sonnet이 사용자에게 제공됨에 따라 이러한 발전이 AI 기반 코딩 및 일반적인 생산성에 미칠 영향에 대한 기대가 더욱 커지고 있습니다.