개발 인공지능

D

dev_to

2025. 06. 07

왜 챗GPT는 존재하지 않는 과학적 인용을 생성하는가?

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

- 과학 연구자, 학생, 교육자, 정책 입안자 및 기자 등 AI를 활용한 학문적 글쓰기에 관심 있는 사람

- 난이도: 중간 (AI 기술 이해 필요)

핵심 요약

챗GPT는 훈련 데이터에 없는 과학적 인용을 생성하여 "가상 인용"을 만들 수 있음
인용은 사실 확인의 핵심이지만, 챗GPT는 통계적 확률을 기반으로 문맥만 모방함
실제 존재하지 않는 인용이 학문적 신뢰도와 정책 결정에 심각한 영향을 줌

섹션별 세부 요약

1. 인용의 역할과 중요성

과학적 주장은 인용을 통해 기존 연구의 신뢰성을 보장
인용은 학문적 검증 체계의 기반이자, 사실 확인의 핵심 요소
실존하는 연구에 대한 참조 링크와 DOI가 필요

2. 챗GPT의 인용 생성 방식

APA, MLA 등 표준 형식을 준수하며, 저자 이름과 저널 명은 실제와 유사하게 생성
DOI 및 URL은 유효한 형식을 갖지만, 실제 연구는 존재하지 않음
AI는 훈련 데이터의 패턴을 기반으로 문맥을 생성 (예: "Silicon-enriched functional meat enhances colonic barrier function" 등)

3. 현실 세계의 사례와 영향

화이트 하우스 보고서에 포함된 가상 인용은 국가 건강 정책 결정에 오류를 유발
"Harry Potter"가 2024년 연구로 잘못 인용된 사례 등, 심각한 정보 오류 발생 가능성
학문적 신뢰도 하락 및 정보 전쟁(가짜 정보를 퍼뜨리는 악의적 행위) 유발

4. 챗GPT의 한계와 원인

실시간 데이터베이스 접근 불가 (PubMed, JSTOR 등)
인용 생성은 "문맥 예측"이지, 사실 확인이 아님
구체적 저자 이름, 논문 제목, 저널 정보는 훈련 데이터에 희소함

5. 해결 방안과 향후 방향

AI 개발자 및 사용자에게 인용 검증의 중요성 강조
브라우저 플러그인과 데이터베이스 연동된 챗GPT 버전(예: ScholarAI, Scite.ai) 활용
인용 생성을 "검색 태스크"로 설계하여 실제 데이터베이스에서만 인용 추출

결론

챗GPT의 인용 생성은 훈련 데이터에 없는 가상의 인용으로, 학문적 신뢰도를 훼손
AI 생성 인용은 절대적으로 검증이 필요하며, 실시간 데이터베이스 연결 기능을 활용해야 함
향후 AI 모델은 인용 생성을 검증 가능한 데이터베이스 기반으로 개선해야 함

ChatGPT scientific citations hallucinated references AI large language models academic integrity information warfare

목록으로 원문 보기