멀티턴 대화에서 LLM의 한계

카테고리

프로그래밍/소프트웨어 개발

인공지능

- 길어지는 대화에서 맥락 유지 실패

- 연결성 상실로 인한 응답 불일치

- 35만 토큰 사용 시도 중 맥락 오염 발생

- Gemini, ChatGPT 등 모델 모두 단순한 개념 확장 실패

- IPSEC 디버깅 실험에서 LLM의 복잡한 정보 단순화 강점 vs 단순한 개념 확장 약점

- 메모리 기능 사용 시 오염된 맥락 복구 불가

- "편집" 버튼 활용 (Claude, ChatGPT)

- 대화 분할 및 요약 (예: promptdown, TSCE 사용)

- 서브컨텍스트 LLM 활용

- 메시지 삭제 기능으로 불필요한 맥락 제거

- 자연어 처리에서 추가 정보 요청 강화 (예: Gemini 2.5 Pro 활용)

- RL 기반 post-training의 장기 프리퍼런스 개선

- 대화 분기/포킹 기능 구현 (예: Telegram bot experai_bot)

- 메모리 리셋 또는 정화 기능 도입

- FileKitty (소스코드 합치기)

- Cursor (자동 요약 기능 테스트)

- Gemini 2.5 Pro 또는 Claude-3.7-Sonnet 활용 (추가 정보 요청 성능 우수)