구글, 기업 타깃 '제미나이 2.5' 모델군 강화..."라인업 늘리고 가격 인하"
카테고리
데이터 과학/AI
서브카테고리
인공지능
대상자
- AI 개발자 및 기업 IT 책임자
- 고비용 AI 모델 사용에 부담을 느끼는 중소/중견 기업
- 복잡한 추론 작업이 필요한 기술 팀
- 난이도 관점: 중간~고급 (모델 성능, 가격 전략, 기술적 세부사항 포함)
핵심 요약
- 제미나이 2.5 모델군 출시
Gemini 2.5 Pro
: 멀티모달, 100만 토큰 처리, 수학 및 코딩 성능 강화Gemini 2.5 Flash
: 성능/효율 균형, 대규모 문서 요약 및 챗봇 애플리케이션 최적화Gemini 2.5 Flash-Light
: 번역/분류 성능 향상, 초저가 요금제로 기업 타깃- "사고 예산(thinking budget)" 기능 도입
- 사용자 지정으로 추론 시간 할당 가능, 정확도와 일관성 향상
- 가격 전략 변화
Flash-Light
: 입력 100만 토큰당 0.10달러, 출력 100만 토큰당 0.40달러 (기존 대비 10~25분의 1 수준)
섹션별 세부 요약
1. 모델군 출시 및 특징
- 제미나이 2.5 모델군 구성
Pro
: 멀티모달, 100만 토큰 입력 처리Flash
: 대규모 문서 요약, 챗봇 애플리케이션에 최적화Flash-Light
: 번역, 분류 등 지연 시간이 중요한 작업에 특화- "사고 예산" 기능
- 사용자 요청에 따라 추론 시간 조정 가능
- 복잡한 문제 해결 능력 강화
- "전문가혼합(MoE)" 구조 채택
- 매개변수 중 일부만 활성화, 하드웨어 자원 효율화
2. 성능 및 벤치마크
- Gemini 2.5 Pro 성능
- 내부 테스트 결과: o3-미니 모델 대비 수학/코딩 성능 우수
- Gemini 2.5 Flash-Light 성능
- 번역, 분류 등 지연 시간 작업에 특화
- 코드, 수학, 과학, 추론, 멀티모달 등 다양한 기준에서 품질 향상
3. 가격 전략 및 기업 타깃
- Flash-Light 요금제
- 입력 100만 토큰당 0.10달러, 출력 100만 토큰당 0.40달러 (기존 2.5 Pro 대비 10~25분의 1)
- Flash 모델 가격 조정
- 입력 요금 인상: 0.15달러 → 0.30달러
- 출력 요금 인하: 3.50달러 → 2.50달러
- 비용 효율성 균형 설계
결론
- "사고 예산" 기능과 MoE 구조 도입으로 복잡한 추론 작업 최적화
- 가격 전략 변화를 통해 기존 고비용 AI 사용자 유치
- 기업용 작업에 맞춘 모델 라인업 확대
- 실무 적용 시: 작업 유형에 따라 모델 선택 (예: 문서 요약 →
Flash
, 복잡한 추론 →Pro
) 및 비용 효율성 분석 필수