한국형 GPT 개발 위한 정부의 AI 데이터 수집 전략
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

한국형 GPT의 필수요소…정부, AI 학습용 데이터 민간서 직접 모은다

카테고리

데이터 과학/AI

서브카테고리

인공지능, 머신러닝

대상자

AI 개발자, 데이터 기업, 정부 및 공공 기관 담당자 / 중간~고급 수준

핵심 요약

  • 정부가 '독자 AI 파운데이션 모델 프로젝트'를 통해 민간 및 공공 데이터 기관을 모집, AI 학습 데이터 확보에 중점
  • GPU, 데이터, 인재 등 핵심 인프라 지원을 통해 한국형 파운데이션 모델 개발을 추진
  • 데이터 제공 시 무상 및 유상 제공 방식에 따른 지원과 보상 체계 마련

섹션별 세부 요약

1. 프로젝트 개요

  • 과기정통부가 자체 초거대 AI 모델 개발을 위해 데이터, 인재, GPU 등 인프라를 일괄 지원
  • '독자 AI 파운데이션 모델 프로젝트' 공모를 통해 개발팀 선발 및 지원
  • 내년부터 본격적인 AI 전략 과제로 추진

2. 데이터 공급 조건

  • 텍스트, 이미지, 음성 등 다양한 형태의 데이터를 보유한 기관 참여 가능
  • 저작권 및 소유권 등 적법한 권원 확보가 필수 조건
  • 데이터 공급 여부는 개발팀 수요에 따라 협약으로 결정

3. 데이터 공급 방식 및 지원

  • 무상 제공 시 OCR 처리, 중복 제거 등 기초 지원 및 실비 보전 제공
  • 유상 제공 시 비상업적 활용 조건에 따라 가격 협의 및 보상
  • 상용화 시 별도 협의 필요

4. 참여 기관 인센티브

  • 데이터 바우처 사업 등 정부 사업 참여 시 가점 부여 검토
  • AI 기반 서비스 우선 도입 기회 제공
  • 데이터 유통 관심 기관에 AI 허브 상품 등록 및 거래 활성화 지원

결론

  • 정부의 AI 학습 데이터 확보 전략을 통해 한국형 파운데이션 모델 개발에 주요 인프라 지원
  • 데이터 공급 기관 모집 및 지원 체계를 통해 AI 개발의 기반 마련
  • 무상 및 유상 제공 방식에 따른 적절한 보상 체계가 핵심 성공 요소