카카오, 가드레일 모델 ‘카나나 세이프가드’ 오픈 소스 공개
카테고리
인공지능
서브카테고리
인공지능, 머신러닝
대상자
AI 개발자, 기업 R&D 팀, 안전성 정책 연구자
핵심 요약
- 카나나 세이프가드 3종(유해성 탐지, 법적 요청 탐지, 공격 탐지)을 Apache 2.0 라이선스로 오픈 소스 공개
- 한국어 성능에서 글로벌 모델을 초과하는 F1-Score 기록
- AI 안전성 강화를 위한 책임감 있는 기술 개발 방향 제시
섹션별 세부 요약
1. 모델 개요 및 목적
- 카나나 세이프가드 3종:
- 유해성 탐지: 증오, 괴롭힘, 성적 콘텐츠 탐지
- 법적 요청 탐지: 개인정보, 지식재산권 관련 요청 감지
- 공격 탐지: AI 서비스 악용 시도 탐지
- 자체 구축 데이터셋과 ‘카나나’ 모델 활용
2. 오픈 소스 공개 및 라이선스
- 허깅페이스에 공개, 상업적 이용 및 수정/재배포 허용
- Apache 2.0 라이선스 적용, 지속적인 성능 고도화 예정
3. 성능 평가 및 결과
- F1-Score 기준, 한국어 성능에서 글로벌 모델을 초과
- AI 안전성 리더 김경훈의 발언: "책임감 있는 AI 구축" 방향 강조
결론
- Apache 2.0 라이선스를 통해 AI 안전성 기술 공유 확대, 사회적 가치 기반 개발 권장
- F1-Score 성능을 기준으로한 국내 모델 기술 우위 강조