개발 인공지능

Z

zdnet

2025. 05. 23

앤트로픽 클로드4 출시: 코딩 성능 72.5% 향상

앤트로픽, '클로드4' 출시…코딩·에이전트 성능 한계 넘었다

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

소프트웨어 개발자, AI 연구자, 기술 팀원
중간~고급 수준의 기술 이해도를 가진 개발자

핵심 요약

클로드4(Opus4, Sonnet4)는 코딩 벤치마크(SWE-bench)에서 기존 모델 대비 72.5%~72.7% 성능 향상
'확장된 사고(Extended Thinking)' 기능을 통해 외부 도구와 병행 실행, 메모리 파일 기능으로 장기 프로젝트 맥락 유지 가능
개발자용 '클로드 코드' SDK 제공, VS코드·젯브레인 통합 및 CI 오류 자동 대응 기능 포함

섹션별 세부 요약

1. 모델 출시 및 상용화

앤트로픽이 '클로드4'의 두 버전인 오푸스4와 소네트4를 즉시 상용화
AWS Bedrock, Google Vertex AI 플랫폼에서 제공
오푸스4: 유료 요금제 전용, 소네트4: 무료 이용자 포함 가능

2. 성능 향상 및 기능 개선

오푸스4: 코딩 벤치마크 SWE-bench에서 72.5% 기록, Terminal-bench 43.2% 기록
소네트4: SWE-bench 72.7% 기록, 코드 구현 제어 능력 기존 모델 대비 개선
확장된 사고(Extended Thinking): 외부 도구(웹 검색 등) 활용, 내부 사고 과정 요약 가능

3. 메모리 기능 강화

오푸스4: 로컬 파일 접근 허용 시 '메모리 파일' 생성, 장기 프로젝트 맥락 일관성 유지
포켓몬 게임 플레이 시 내비게이션 가이드 자동 작성 사례로 기능 설명

4. 클로드 코드 SDK 및 통합 기능

VS코드, 젯브레인 등 통합 개발 환경에 통합
코드 수정 제안 파일 내 표시로 페어 프로그래밍 효율 향상
깃허브 액션 활용 백그라운드 작업 및 CI 오류 자동 대응 기능 포함

결론

클로드4 모델의 '확장된 사고' 기능과 메모리 기능 활용으로 복잡한 코딩 및 장기 작업 효율성 극대화
클로드 코드 SDK를 통한 개발 환경 통합은 실시간 피드백 및 자동 수정 기능으로 개발 생산성 향상
AI 모델 성능 지표(SWE-bench 등) 기반으로 기술 경쟁력 확보 전략 수립 권장

클로드4 앤트로픽 코딩 확장 추론 장기 메모리 생성형 AI AI 시장

목록으로 원문 보기