미스트랄 스몰 3.2 모델, 안정성·정밀도 향상 및 GPU 메모리 최소화
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

미스트랄, 멀티모달 모델 ‘스몰 3.2’ 공개..."활용성 강화한 마이너 업데이트"

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

  • 개발자, 기업
  • 난이도: 중상 (AI 모델 성능 평가 지표, 기술적 구현 세부 사항 포함)

핵심 요약

  • 모델 개선 초점: 안정성 및 정밀도 향상 (무한 반복 생성 감소, 지시문 수행 정확도 82.75% → 84.78% 상승)
  • 성능 향상: WildBench v2 정확도 +10%, Arena Hard v2 43.10% 달성 (기존 19.56% 대비 2배 이상 향상)
  • 자원 효율성: bf16/fp16 정밀도로 55GB GPU 메모리만 필요 (중소기업/개발자 접근성 강화)

섹션별 세부 요약

1. **모델 개요 및 업데이트 방향**

  • 버전: Mistral Small 3.2-24B Instruct-2506 (240억 매개변수)
  • 업데이트 특징: 구조 변화 없이 행동 개선 (지시문 수행, 함수 호출 안정성, 무한 반복 생성 감소)
  • 사용 사례: VLM, Transformers 프레임워크에서 복잡한 작업 처리 강화

2. **성능 평가 및 벤치마크 결과**

  • HumanEval+ 정확도 88.99% → 92.90%, MBPP 74.63% → 78.33%
  • WildBench v2 정확도 +10%, Arena Hard v2 43.10% 달성
  • MMLU 미세한 성능 저하 (80.62% → 80.50%)

3. **자원 요구 사항 및 배포 방식**

  • 메모리 요구: A100/H100 GPU 기반 55GB (bf16/fp16 정밀도)
  • 배포 채널: Hugging Face 직접 배포 (3.1은 Google Cloud Vertex AI, NVIDIA NIM 등에 통합)
  • 상업적 사용 허용 (시스템 프롬프트 예시 및 추론 샘플 제공)

결론

  • 실무 적용 팁: Hugging Face에서 제공되는 3.2 버전자원 제한 환경에서 활용 가능하며, Arena Hard v2 성능 향상이 주요 기능 개선 사항임. MMLU의 미세한 성능 저하는 다른 벤치마크 대비 상대적으로 미미한 영향.