앤트로픽이 5월 23일 차세대 대규모 언어모델 ‘클로드 오푸스 4’와 ‘클로드 소넷 4’를 출시했습니다. 이번 신모델은 복잡한 코딩 작업과 장기 추론, AI 에이전트 활용에 최적화된 설계로 개발자 및 기업 고객의 주목을 받고 있습니다.
‘클로드 오푸스 4’는 앤트로픽이 “역대 최고 수준”이라고 평가한 최상위 모델로, SWE-bench 벤치마크에서 72.5%, Terminal-bench에서 43.2%를 기록하며 코딩 성능에서 경쟁 모델을 앞섰습니다. 수천 단계에 달하는 장기 작업에서도 지속적인 성능을 유지하며, AI 에이전트가 자율적으로 복잡한 업무를 처리하는 데 강점을 보입니다. 예를 들어 포켓몬 게임 플레이 중 오푸스 4가 직접 ‘내비게이션 가이드’를 생성한 사례가 공개됐습니다.
한편 ‘클로드 소넷 4’는 기존 소넷 3.7의 업그레이드 버전으로, SWE-bench에서 72.7%를 기록하며 실용성과 비용 효율성에 집중했습니다. 지시 수행력, 코드 제어, 문제 해결 능력에서 개선됐으며, 깃허브 코파일럿 차세대 에이전트 모델로 채택되는 등 다양한 실사용 환경에 적합한 모델로 평가받고 있습니다.
이번 클로드 4 시리즈는 ‘확장된 사고(Extended Thinking)’ 기능을 도입해, 추론 중 웹 검색 등 외부 도구를 병행 사용할 수 있으며 도구 병렬 실행, 메모리 향상, 프롬프트 캐시 등의 기능도 포함됐습니다. 모델이 편법적 해결에 의존할 확률은 기존 대비 65% 줄었으며, 내부 사고 과정을 요약하는 기능도 새롭게 도입됐습니다.
코딩 지원 도구인 ‘클로드 코드’도 정식 출시됐습니다. VS코드, 젯브레인 통합을 지원하고, 깃허브 액션과 연계한 자동화 기능 및 백그라운드 작업이 가능합니다. 개발자는 제공된 SDK를 활용해 자체 AI 에이전트를 만들 수 있으며, GitHub와 연동해 리뷰 피드백 대응이나 오류 수정을 자동화할 수 있습니다.
가격은 오푸스 4가 입력 토큰 백만 개당 15달러, 출력 기준 75달러이며, 소넷 4는 각각 3달러, 15달러로 책정됐습니다. 소넷 4는 무료 사용자도 이용 가능하며, 양 모델은 앤트로픽 API, 아마존 베드록, 구글 버텍스 AI 등 다양한 플랫폼에서 제공됩니다.











