개발 프로그래밍/소프트웨어 개발

D

dev_to

2025. 05. 08

LLM 기반 채팅 앱에서 컨텍스트 기반 응답 구현 방법 (Stream, Anthropic API)

제목

AI 채팅 앱에서 컨텍스트 기반 응답 구현 방법

분야

프로그래밍/소프트웨어 개발

대상자

- LLM 기반 챗봇 개발자: 상태 관리 및 컨텍스트 유지 기능 구현이 필요한 개발자

- Stream 및 Anthropic API 사용자: 채팅 서비스와 AI 모델 연동을 고려하는 개발자

- 난이도: 중급 ~ 고급 (API 통합 및 상태 관리 구현이 필요)

핵심 요약

*LLM은 상태가 없는 무상태 시스템**
LLM(예: Claude, GPT)는 각 API 요청이 무상태(stateless)로 처리되며, 채팅 히스토리 관리를 개발자 책임
"메모리 가상화 패턴" 사용: 채팅 히스토리 추적 및 전달을 통해 AI가 컨텍스트를 유지하도록 설계
Stream API를 활용해 채팅 히스토리 관리 및 실시간 응답 처리

섹션별 세부 요약

1. LLM의 무상태 특성과 해결 방안

LLM의 기본 동작: 각 API 요청은 독립적 처리되며, 전역 상태를 저장하지 않음
실제 채팅 인터페이스: 공식 인터페이스는 배경에서 히스토리 관리를 수행해 "메모리" 효과 제공
필수 해결책: 개발자는 채팅 히스토리를 직접 관리하고, 각 요청 시 전달해야 함

2. AnthropicAgent 클래스 구현 방식

StreamChat 및 Anthropic API 연동: 채팅 서비스와 AI 모델 통합
이벤트 리스너 설정: message.new 이벤트를 통해 사용자 메시지 처리
메시지 필터링: AI 생성 메시지 및 공백 제거 후, 사용자/아이보트 역할 구분

3. 채팅 히스토리 구성 및 전달

메시지 슬라이싱: 최근 5개 메시지만 추출 (.slice(-5))
메시지 형식 변환: Anthropic의 role 및 content 형식으로 정리
스레드 처리: parent_id를 통해 채팅 스레드의 부모 메시지와 연결

4. AI 응답 전송 및 실시간 처리

Anthropic API 호출: 구성된 히스토리 전달 후 응답 생성
Stream 채팅 채널 업데이트: sendMessage 및 sendEvent로 AI 응답 실시간 반영
부분 메시지 업데이트: partialUpdateMessage로 타이핑 효과 구현

5. 상태 관리 및 오류 처리

메시지 삭제 테스트: 히스토리 삭제 후 AI가 컨텍스트를 잃는 것을 확인
에러 처리: run 메서드에서 스트림 이벤트 오류 시 상태 업데이트
메모리 조절: .slice(-N)을 통해 AI의 기억 길이 조절 (예: 2~10개 메시지)

결론

*AI 챗봇의 컨텍스트 유지 핵심 전략**
Stream의 채팅 상태 관리를 활용해 메시지 히스토리 자동 저장
Anthropic API에 히스토리 전달을 통해 AI의 컨텍스트 유지 가능
실무 팁:

- 간단한 Q&A 시 2~3개 메시지, 복잡한 대화 시 10개 이상의 히스토리 사용

- 채팅 인터페이스는 내부에서 히스토리 전송, 개발자는 Stream의 channel.state.messages 활용

- 메모리 크기 조절 시 퍼포먼스와 정확도의 균형 고려

Stream의 강점:

- channel.sendMessage(), sendEvent() 등의 API로 커스터마이징 없이 실시간 챗봇 구현

- 메시지 ID 기반의 정확한 상태 추적 및 업데이트 가능

ChatGPT Claude LLMs context-aware AI Stream Anthropic API message history

목록으로 원문 보기