RAG 및 LangChain 기초

카테고리

프로그래밍/소프트웨어 개발

인공지능

RAG(Retrieval-Augmented Generation): LLM의 사전 학습 데이터 제한을 극복하기 위해 외부 정보 검색을 결합한 아키텍처 패턴
LangChain: RAG 시스템 구현을 위한 Python 프레임워크로, PyPDFLoader, Chroma, RetrievalQA 등 핵심 API 제공
RAG 파이프라인: 문서 로딩 → 임베딩 → 벡터 검색 → 문맥 조합 → LLM 생성 단계로 구성

- 도메인 특화 정보 접근 가능

- hallucination 감소

- 재학습 없이 지식 업데이트

- DirectoryLoader로 문서 로딩

- RecursiveCharacterTextSplitter로 텍스트 분할

- OpenAIEmbeddings 및 Chroma로 벡터 저장소 구축

```python

from langchain.document_loaders import DirectoryLoader

loader = DirectoryLoader('./docs', glob="**/*.md")

documents = loader.load()

```

- RecursiveCharacterTextSplitter로 1000자/200자 중복 분할

- OpenAIEmbeddings로 텍스트를 벡터화 후 Chroma에 저장

- RetrievalQA로 질의 처리, gpt-3.5-turbo 모델 사용

```python

llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

qa_chain = RetrievalQA.from_chain_type(llm=llm, retriever=vectorstore.as_retriever())

```

- Optimal Chunk Size: 500-1000자, 100-200자 중복

- LangChain의 캐시 기능: InMemoryCache로 비동기 처리 최적화

- 멀티 쿼리 검색: MultiQueryRetriever로 검색 품질 향상

실무 적용: 단순한 RAG 시스템부터 시작해, SelfQueryRetriever, Graph-based Knowledge 등 고급 기법 도입
문서 출처: LangChain 공식 문서 참조하여 직접 테스트 및 확장 추천