MemoryOS MCP 및 RAG를 활용한 멀티 에이전트 챗봇 개발 튜토리얼

📅 2025-06-23T06:57:52Z 👤 Gao Dalie (高達烈) 🏷️ 개발

완성도:

0.9

🤖 AI 추천

이 콘텐츠는 LLM의 장기 기억력 한계를 극복하고 사용자 경험을 향상시키고자 하는 AI/ML 엔지니어, 백엔드 개발자, 그리고 대화형 AI 시스템 구축에 관심 있는 모든 개발자에게 매우 유용합니다.

이 튜토리얼은 LLM의 제한된 컨텍스트 창 문제를 해결하기 위해 MemoryOS의 계층적 메모리 시스템(단기, 중기, 장기)과 RAG(Retrieval Augmented Generation) 기법을 결합하여 멀티 에이전트 챗봇을 구축하는 방법을 소개합니다.

MemoryOS 아키텍처:
- 단기 기억 (Short-Term Memory - STM): 실시간 대화 QA 쌍 저장
- 중기 기억 (Mid-Term Memory - MTM): 주제 기반 세그먼트 그룹화 및 '열(heat)' 기반 관리
- 장기 기억 (Long-Term Personal Memory - LPM): 사용자 특성, 선호도, 인사이트 저장
MCP (Memory Chunking Planning):
- 대화 기록 및 지식을 관리 가능한 청크로 분할하여 계층적 아키텍처에 맞춤.
- 관련성, 최근성, 중요도에 따라 메모리 청크 검색 계획 및 최적화.
- 동적 메모리 업데이트 및 '열' 기반 제거 전략 지원.
작동 방식:
- 사용자 입력 및 에이전트 응답은 QA 쌍으로 STM에 저장.
- STM 용량 초과 시 Updater 모듈이 세그먼트로 통합하여 MTM으로 이동.
- MTM 세그먼트의 '열'이 임계값 초과 시 사용자 프로필 및 에이전트 지식 기반 업데이트를 위해 LLM 분석.
- 응답 생성 시 Retriever 모듈이 STM, MTM, LPM 등 관련 컨텍스트를 검색하여 LLM에 전달.
MCP Tool Server:
- FastMCP 프레임워크를 사용하여 add_memory 도구 함수 구현.
- add_memory 함수는 사용자 입력, 에이전트 응답, 타임스탬프, 메타데이터를 받아 MemoryOS 인스턴스에 메모리 저장.
- 메모리 추가 시 오류 처리 및 성공/실패 결과 반환.
- retrieve_memory 함수는 사용자 질문 기반으로 다양한 메모리 계층에서 관련 정보 검색.