개발 인공지능

A

aitimes

2025. 05. 30

딥시크 R1-0528 업데이트: 성능 향상 및 기능 개선

딥시크, 'R1' 업데이트 정보 추가 공개..."o3·제미나이 2.5에 성능 근접"

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

AI 모델 개발자, 연구자, 프런티어 모델 비교 분석자
난이도 관점: 중간~고급 수준 (성능 지표, 기술적 개선 사항 포함)

핵심 요약

성능 향상: R1-0528은 AIME 2025(수학)에서 70% → 87.5%, LiveCodeBench(코딩)에서 63.5% → 73.3% 성능 향상
기능 개선: JSON 출력, 함수 호출 기능 추가 및 사고 모드(Thinking Mode)의 시스템 프롬프트 방식 전환
확장성: 16GB VRAM GPU 지원으로 디피시크-R1-0528-큐원3-8B 모델의 10% 성능 향상

섹션별 세부 요약

1. R1-0528 버전 개요

MIT 라이선스 공개, 상업적 사용 및 커스터마이징 허용
API 사용자 자동 업데이트 (입력: 100만 토큰당 0.14달러, 출력: 2.19달러)
개인 사용자: 공식 웹사이트에서 무료 체험 가능

2. 성능 향상 및 벤치마크 결과

환각/오해 감소: 45~50% 감소
AIME 2025: 1만2000 → 2만3000 토큰 사용 (사고 과정 깊이 증가)
인류의 마지막 시험: 8.5% → 17.7% 성능 향상 (2배 이상 개선)

3. 기능 개선 및 사용 편의성

JSON 출력, 함수 호출 기능 추가 → 애플리케이션 통합 용이
프론트엔드 상호작용 매끄럽고 효율화
사고 모드 시스템 프롬프트 방식으로 배포 간편화

4. 디피시크-R1-0528-큐원3-8B 모델

큐원3-8B 대비 10% 성능 향상, 큐원3-235B-싱킹 수준 달성
16GB VRAM GPU 지원 → 하드웨어 부담 감소 및 학술·산업 활용 가능성

5. 검열 우려 및 차세대 모델 전망

중국 정부 민감 주제 검열 강화 (스피치맵 개발자 "xlr8harder" 보고)
R2 모델 개발 예정 (R1 시리즈 마지막 모델 가능성)

결론

성능 향상과 사용자 편의성 개선을 통해 o3·제미나이 2.5와 경쟁 가능
16GB VRAM GPU 지원 모델은 중소기업·학술 연구에 적합
검열 문제 주의 필요, R2 모델 출시 기대감 상승

딥시크 R1-0528 성능향상 기능개선 벤치마크 AI 추론모델

목록으로 원문 보기