딥시크, 'R1' 업데이트 정보 추가 공개..."o3·제미나이 2.5에 성능 근접"
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능
대상자
- AI 모델 개발자, 연구자, 프런티어 모델 비교 분석자
- 난이도 관점: 중간~고급 수준 (성능 지표, 기술적 개선 사항 포함)
핵심 요약
- 성능 향상:
R1-0528
은 AIME 2025(수학)에서 70% → 87.5%, LiveCodeBench(코딩)에서 63.5% → 73.3% 성능 향상 - 기능 개선: JSON 출력, 함수 호출 기능 추가 및
사고 모드(Thinking Mode)
의 시스템 프롬프트 방식 전환 - 확장성: 16GB VRAM GPU 지원으로 디피시크-R1-0528-큐원3-8B 모델의 10% 성능 향상
섹션별 세부 요약
1. R1-0528 버전 개요
- MIT 라이선스 공개, 상업적 사용 및 커스터마이징 허용
- API 사용자 자동 업데이트 (입력: 100만 토큰당 0.14달러, 출력: 2.19달러)
- 개인 사용자: 공식 웹사이트에서 무료 체험 가능
2. 성능 향상 및 벤치마크 결과
- 환각/오해 감소: 45~50% 감소
- AIME 2025: 1만2000 → 2만3000 토큰 사용 (사고 과정 깊이 증가)
- 인류의 마지막 시험: 8.5% → 17.7% 성능 향상 (2배 이상 개선)
3. 기능 개선 및 사용 편의성
- JSON 출력, 함수 호출 기능 추가 → 애플리케이션 통합 용이
- 프론트엔드 상호작용 매끄럽고 효율화
- 사고 모드 시스템 프롬프트 방식으로 배포 간편화
4. 디피시크-R1-0528-큐원3-8B 모델
- 큐원3-8B 대비 10% 성능 향상, 큐원3-235B-싱킹 수준 달성
- 16GB VRAM GPU 지원 → 하드웨어 부담 감소 및 학술·산업 활용 가능성
5. 검열 우려 및 차세대 모델 전망
- 중국 정부 민감 주제 검열 강화 (스피치맵 개발자 "xlr8harder" 보고)
- R2 모델 개발 예정 (R1 시리즈 마지막 모델 가능성)
결론
- 성능 향상과 사용자 편의성 개선을 통해 o3·제미나이 2.5와 경쟁 가능
- 16GB VRAM GPU 지원 모델은 중소기업·학술 연구에 적합
- 검열 문제 주의 필요, R2 모델 출시 기대감 상승