제목
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
개발 툴
대상자
- *소프트웨어 개발자**
- 난이도: 중급 이상 (LLM, 벡터 DB, 코드 처리 기술 필요)
핵심 요약
- 개인 노트를 기반으로 한 LLM 기반 AI 코파일럿 구축
Instructor-XL
,Chroma
,Phi-3
등 오픈소스 모델 활용.md
,.txt
,.bash_history
등의 파일을 벡터 DB에 저장하여 검색 가능- 개발자 생산성 향상
- 과거 코드, 명령어, 팁의 즉시 검색 가능 (
"How did I deploy that huggingface model?"
등) - 중복된 작업 방지, 지식 재사용 촉진
- 개인화된 지식 관리 체계
- Git 커밋 메시지, 코드 주석, 노트 연결을 통해 시간 기반 탐색 가능
섹션별 세부 요약
1. 개인 노트 기반 AI 코파일럿 구현
- 문제 정의
- 개발자 노트(
cheatsheet.md
,docker-fix-notes.md
등)의 저장 후 사용 시 애로 - 과거 경험을 기반으로 한 실시간 답변 필요성 제기
- 해결 방안
Instructor-XL
로 문서 인코딩,Chroma
로 벡터 DB 생성Phi-3
모델을 사용한 로컬 LLM 구현 (VS Code 인터페이스 연동)
2. 구현 과정 및 기술 스택
- 데이터 수집 및 처리
- Python 스크립트로
.md
,.txt
,.ipynb
,.bash_history
파일 자동 수집 langchain.document_loaders.TextLoader
사용- 검색 및 답변 시스템
- 자연어 질문에 대해
Chroma
DB에서 벡터 유사도 기반 검색 - 예:
"What’s the SSH trick for Django + Postgres in Docker?"
→til-docker.md
에서 추출
3. 확장 기능 및 활용 사례
- 커밋 기록과 노트 연동
- GitHub 커밋 메시지,
README.md
, 코드 주석 파싱 - 타임스탬프 기반으로
tokenizer.py
v1/v2 차이점 검색 가능 - 실무 적용 효과
- 과거 해결 방법 재사용 (
bugfix-log-2023.md
등) - 노트 작성 방식 개선 (사용 예상 시 보다 체계적 작성)
결론
- 개발자 개인 지식을 기반으로 한 AI 코파일럿 구현
Instructor-XL
+Chroma
+Phi-3
활용, VS Code 연동- 핵심 팁: 개인 노트를 벡터 DB에 저장하고, LLM으로 질문에 대답받는 방식으로 생산성 향상 가능
- 예시:
mycopilot "What’s the SSH trick for Django + Postgres in Docker?"
→ 실시간 답변 제공