크래프톤, AI 에이전트의 ‘게임 수행 능력’ 평가하는 벤치마크 ‘오락’ 공개
카테고리
트렌드
서브카테고리
인공지능
대상자
- AI 연구자, 게임 개발자, LLM(대규모 언어 모델) 기술 개발자
- 중급~고급 수준: AI 평가 체계와 기술 구현 방식 이해 필요
핵심 요약
- ‘오락(Orak)’은 6개 게임 장르를 기반으로 AI 에이전트의 게임 수행 능력을 정량적으로 평가하는 AI 벤치마크
- MCP(Model Context Protocol)를 통해 게임 상태를 텍스트/이미지로 변환 후 AI 모델이 최적 행동을 결정하도록 지원
- 엔비디아와 공동 개발한 CPC 기술을 반영하여 AI-인간 협력 플레이 경험 혁신을 목표
섹션별 세부 요약
1. 오락 벤치마크 개요
- 6개 장르(액션, 어드벤처, RPG, 시뮬레이션, 전략, 퍼즐) 기반의 AI 평가 체계 설계
- 엔비디아와 공동 개발한 ‘CPC(Co-Playable Character)’ 기술을 반영
- AI 에이전트가 복잡한 게임 맥락에서 상황 인식 및 판단 능력 평가
2. MCP 기술 역할
- 게임 정보를 텍스트로 변환하여 AI 모델이 이해 및 응답 가능
- AI 모델의 응답을 게임 행동으로 전환하는 역할 수행
- 예: 액션 게임에서 장애물 위치 인식 후 이동/점프 판단 가능
3. 연구 확장 및 데이터셋 제공
- LLM 미세조정 전용 데이터셋 제공: 사전 학습 모델을 게임 환경에 맞게 최적화 가능
- 게임 산업 외 분야로 연구 확장 계획
- ICLR, ICML 등 국제 AI 학회에 논문 10편 채택
결론
- MCP 기술과 6개 게임 장르 기반 평가 체계를 통해 AI 에이전트의 게임 능력을 정량적으로 검증 가능
- LLM 미세조정 데이터셋 활용으로 게임 환경 맞춤형 AI 개발 가속화
- 향후 AI 에이전트 설계 대회 기획 계획으로, 게임 분야에 최적화된 LLM 기술 지속적 고도화 예정