크래프톤, AI 에이전트 게임 수행 능력 평가 벤치마크 '오락' 공개
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

크래프톤, AI 에이전트의 ‘게임 수행 능력’ 평가하는 벤치마크 ‘오락’ 공개

카테고리

트렌드

서브카테고리

인공지능

대상자

  • AI 연구자, 게임 개발자, LLM(대규모 언어 모델) 기술 개발자
  • 중급~고급 수준: AI 평가 체계와 기술 구현 방식 이해 필요

핵심 요약

  • ‘오락(Orak)’6개 게임 장르를 기반으로 AI 에이전트의 게임 수행 능력을 정량적으로 평가하는 AI 벤치마크
  • MCP(Model Context Protocol)를 통해 게임 상태를 텍스트/이미지로 변환 후 AI 모델이 최적 행동을 결정하도록 지원
  • 엔비디아와 공동 개발한 CPC 기술을 반영하여 AI-인간 협력 플레이 경험 혁신을 목표

섹션별 세부 요약

1. 오락 벤치마크 개요

  • 6개 장르(액션, 어드벤처, RPG, 시뮬레이션, 전략, 퍼즐) 기반의 AI 평가 체계 설계
  • 엔비디아와 공동 개발한 ‘CPC(Co-Playable Character)’ 기술을 반영
  • AI 에이전트가 복잡한 게임 맥락에서 상황 인식 및 판단 능력 평가

2. MCP 기술 역할

  • 게임 정보를 텍스트로 변환하여 AI 모델이 이해 및 응답 가능
  • AI 모델의 응답을 게임 행동으로 전환하는 역할 수행
  • 예: 액션 게임에서 장애물 위치 인식 후 이동/점프 판단 가능

3. 연구 확장 및 데이터셋 제공

  • LLM 미세조정 전용 데이터셋 제공: 사전 학습 모델을 게임 환경에 맞게 최적화 가능
  • 게임 산업 외 분야로 연구 확장 계획
  • ICLR, ICML 등 국제 AI 학회에 논문 10편 채택

결론

  • MCP 기술과 6개 게임 장르 기반 평가 체계를 통해 AI 에이전트의 게임 능력을 정량적으로 검증 가능
  • LLM 미세조정 데이터셋 활용으로 게임 환경 맞춤형 AI 개발 가속화
  • 향후 AI 에이전트 설계 대회 기획 계획으로, 게임 분야에 최적화된 LLM 기술 지속적 고도화 예정