Git 저장소를 LLM과 대화하는 방법
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능
대상자
LLM(대규모 언어 모델)과 Git 저장소를 연동하려는 개발자, AI 프로젝트 구현에 관심 있는 중급 이상 개발자
핵심 요약
- Git 저장소를 LLM이 읽을 수 있는 마크다운 형식으로 변환 (
.git
폴더 제외) - Gemini/Mistral-OCR을 활용해 이미지, PDF 등 특수 파일 파싱
- 저장소 데이터 재사용 기능으로 대화 속도 최적화 (커밋/브랜치 정보 매칭 기반)
섹션별 세부 요약
- 프로젝트 개요
- 저장소를 클론 후
.git
폴더 제외한 모든 파일 파싱 - 이미지, PDF 파일은 Gemini/Mistral-OCR을 통해 텍스트로 변환
- 마크다운 형식으로 저장소 내용을 LLM에 제공
- LLM과의 대화 기능
- 대규모 맥락 처리가 가능한 LLM(Gemini)에 변환된 텍스트 제공
- 실시간으로 저장소 내용을 기반으로 질문에 답변 가능
- 속도 개선 전략
- 기존에 처리된 저장소 데이터 재사용 (커밋/브랜치 정보 매칭)
- 불필요한 중복 파싱을 방지해 대화 속도 향상
- 예제 및 배포
- GitHub 저장소에서 직접 코드 확인 가능
- Railway를 통해 단일 클릭 배포 지원
결론
- *Svelte + Hono 기반으로 구현된 프로젝트**에서 저장소 데이터 재사용 기능을 통해 LLM 대화 속도를 향상시키는 것이 핵심 전략입니다.