토스페이먼츠 결제 시스템 연동을 돕는 MCP 서버 구현기

카테고리

프로그래밍/소프트웨어 개발

DevOps

- SSOT(Single Source of Truth) 달성

- 사용자 증가 시 서버 비용 증가 없음

- NPM 패키지 사용으로 관리 비용 절감

- get-keywords: 사전 정의된 키워드 목록 반환

- documents-by-keywords: 키워드 기반 문서 검색

- documents-by-link: 링크 기반 문서 탐색

- document-by-id: ID 기반 문서 조회

- 문서 길이로 인한 Hallucination 발생

- LLM 호출 빈도 증가

- 질의어 빈도와 역문서 빈도(IDF)를 고려한 관련성 측정

- 검색 엔진, RAG 시스템 등에 활용

- 형태소 분석 대신 LLM 기반 토큰화 적용

- 정규식을 통한 질의 토큰화 및 BM25 점수 계산

- unist-util-visit, remark-parse, unified 라이브러리 사용

- #, ## 헤더로 문서 분할 후 30단어 이상 청크만 남김

- 청크 관리 및 키워드 기반 점수 계산

- getChunkWithWindow 메서드로 청크 범위 제어

MCP 서버 구현 시 BM25 알고리즘과 마크다운 청크 분할 전략을 적용하면 대규모 문서 처리와 AI 모델 정확도 향상을 달성할 수 있음.
실무 적용 시:

- unist-util-visit과 remark-parse 라이브러리 활용

- 30단어 이상 청크 기준으로 분할 후 병합

- BM25 점수 계산 시 정규식 기반 토큰화 적용