개발 인공지능, 머신러닝

A

aitimes

2025. 05. 27

카카오, ‘카나나 세이프가드’ Apache 2.0 오픈소스 공개

카카오, 가드레일 모델 ‘카나나 세이프가드’ 오픈 소스 공개

카테고리

인공지능

서브카테고리

인공지능, 머신러닝

대상자

AI 개발자, 기업 R&D 팀, 안전성 정책 연구자

핵심 요약

카나나 세이프가드 3종(유해성 탐지, 법적 요청 탐지, 공격 탐지)을 Apache 2.0 라이선스로 오픈 소스 공개
한국어 성능에서 글로벌 모델을 초과하는 F1-Score 기록
AI 안전성 강화를 위한 책임감 있는 기술 개발 방향 제시

섹션별 세부 요약

1. 모델 개요 및 목적

카나나 세이프가드 3종:

- 유해성 탐지: 증오, 괴롭힘, 성적 콘텐츠 탐지

- 법적 요청 탐지: 개인정보, 지식재산권 관련 요청 감지

- 공격 탐지: AI 서비스 악용 시도 탐지

자체 구축 데이터셋과 ‘카나나’ 모델 활용

2. 오픈 소스 공개 및 라이선스

허깅페이스에 공개, 상업적 이용 및 수정/재배포 허용
Apache 2.0 라이선스 적용, 지속적인 성능 고도화 예정

3. 성능 평가 및 결과

F1-Score 기준, 한국어 성능에서 글로벌 모델을 초과
AI 안전성 리더 김경훈의 발언: "책임감 있는 AI 구축" 방향 강조

결론

Apache 2.0 라이선스를 통해 AI 안전성 기술 공유 확대, 사회적 가치 기반 개발 권장
F1-Score 성능을 기준으로한 국내 모델 기술 우위 강조

AI 가드레일 모델 오픈 소스 카나나 세이프가드 안전 정책 인공지능(AI) 아파치2.0 라이선스 F1 스코어

목록으로 원문 보기