인간 대화 시뮬레이션을 통한 LLM 컨텍스트 제한 극복 및 다중 대화 손실 해결

카테고리

프로그래밍/소프트웨어 개발

인공지능

- LLM 개발자 및 연구자: 다중 대화 시 LLM의 성능 저하 문제 해결

- 난이도: 중급 이상 (기계 학습, 컨텍스트 관리, 토큰 효율성 최적화 기술 필요)

- 인간: 불필요한 정보 제거, 현재 상태 유지

- LLM: 과거 정보 복잡성 증가, 성능 향상 제한

- 키워드 겹침 (40%)

- 의미 유사도 (40%)

- 시간 가중치 (20%)

- 키워드 트리거: Jaccard 유사도 기반 부분 일치 지원

- 의미 유사도: 단순화된 코사인 유사도, 중복 어휘 비율 계산

- 시간 가중치: 24시간 내 선형 감소 (최신=1.0, 24시간 후=0.7)

- [구조화된 요약] + [관련된 과거 대화] + [새로운 질문]

- 관련성 임계값: 0.3 (불필요한 내용 필터링)

- 결과 수 제한: 최대 5개의 관련 기록 반환

LLM의 과거 정보 관리 방식을 인간의 선택적 기억 모델로 시뮬레이션하여 컨텍스트 제한 극복
구조화된 요약 + 모호한 검색 알고리즘으로 토큰 효율성 향상 및 오류 방지
실무 적용 팁: ExcludedOptions 활용, gpt-4o-mini 기반 상태 업데이트, 다차원 점수 알고리즘으로 정확한 대화 추적 가능