개발 머신러닝

A

aitimes

2025. 05. 23

Anthropic, Claude Opus 4 출시: 세계 최고의 코딩 모델

앤트로픽, '클로드 오퍼스 4' 출시..."세계 최고의 코딩 모델"

카테고리

인공지능

서브카테고리

머신러닝

대상자

소프트웨어 개발자, AI 연구자, 엔지니어
중급~고급 수준의 기술 이해도를 가진 사용자

핵심 요약

클로드 4 오퍼스는 코딩 및 에이전트 기능에서 전면 업그레이드 – SWE-Bench 벤치마크에서 72.5% 기록, GPT-4.1(54.6%) 및 제미나이 2.5 프로(63.2%)를 초과
장기 작업 처리 능력 강화 – 7시간 동안 연속 코딩/게임 플레이 가능, 이전 모델(45분) 대비 15배 이상 향상
비추론-추론 하이브리드 모델 도입 – 순차적 사고(논리 추론)와 즉각적 반응 기능 병행

섹션별 세부 요약

1. 모델 출시 배경

앤트로픽은 2024년 '클로드 3 오퍼스' 후속 업데이트 없이 오퍼스 4 개발에 집중
스케일링 법칙 한계 극복을 위해 코딩 및 도구 사용에 특화된 기능 개발
3.5 버전 출시 철회 후, 오퍼스 4에 모든 자원 투입

2. 성능 향상 사항

수천 단계의 장기 작업 처리 가능 – 라쿠텐 그룹 테스트에서 24시간 게임 플레이 + 7시간 코딩 수행
SWE-Bench 벤치마크 72.5% 기록 – 코딩 특화 모델 중 최고 수준
멀티모달 평가(MMMU) 및 GPQA 다이아몬드 지표에서 오픈AI o3 밀리지 않음

3. 혁신 기능

도구 활용 통합 – 검색 엔진 등 다양한 도구 병렬 사용, 추론-도구 사용 반복 작업 지원
기억 유지(memory persistence) – 문서 요약 파일 생성 후 장기 프로젝트에서 맥락 유지
비추론-추론 하이브리드 모델 – 순차적 사고와 즉각적 반응 기능 모두 제공

4. 신규 도구 및 API 업데이트

클로드 코드(Claude Code) – VS Code, 젯브레인, 깃허브 통합, 깃허브 커넥터로 자동 코드 리뷰 피드백 처리
API 기능 추가 – 코드 실행 도구, 모델 컨텍스트 프로토콜(MCP) 커넥터, 파일 API, 프롬프트 캐싱(1시간 유지)

5. 사용 제한 및 가격 정책

오퍼스 4는 유료 사용자 전용
소네트 4는 무료/유료 사용자 모두 사용 가능

결론

개발자에게 실용적인 도구 제공 – 클로드 코드 통합 및 API 기능 업데이트로 AI 에이전트 구축 지원
코딩 특화 모델로 장기 프로젝트 효율성 극대화 – 망각 문제 해결 및 병렬 처리 기능 강화

주요 키워드 5-7개" and the example from the assistant used English terms. But the original keywords include both Korean and English. The user probably wants them translated. So I'll use the English versions. So the keywords would be: AI Claude 4 Opus 4 Sonnet 4 coding model AI agent SWE-Bench long-term task API. But need to pick 5-7. Let me check the original content. The main points are Claude Opus 4 coding model SWE-Bench long-term task hybrid model. So maybe: AI Claude Opus 4 coding model SWE-Bench long-term task hybrid model API. That's seven.

목록으로 원문 보기