RAG 이해하기: LLM 기반 검색 증강 생성 기법

카테고리

프로그래밍/소프트웨어 개발

인공지능

LLM(Large Language Model) 및 검색 시스템을 활용한 응용 개발자, 데이터 과학자

RAG(Retrieval-Augmented Generation)는 LLM의 응답 정확도를 높이기 위해 외부 지식 저장소와 LLM 생성 능력을 결합한 기술
검색(Retrieval): Elasticsearch 등 검색 엔진으로 최신 데이터 추출
증강(Augmentation): 검색 결과를 LLM 입력에 주입해 컨텍스트 확장
LLM 사용 예시: gpt-4o 모델을 통해 확장된 쿼리 기반으로 답변 생성

- Retrieval: 벡터 DB 또는 검색 엔진에서 관련 문서 추출

- Generation: gpt-4o와 같은 기반 모델로 자연어 답변 생성

- Augmentation: 검색 결과를 쿼리에 추가해 LLM의 컨텍스트 확장

- Elasticsearch에서 경기 결과, 선수 성적, 경기장 정보 검색

- 검색 결과를 쿼리에 추가해 LLM에 전달

- LLM이 확장된 쿼리 기반으로 정확한 답변 생성

```python

docker run -it --name elasticsearch -p 9200:9200 -p 9300:9300 \

-e "discovery.type=single-node" \

-e "xpack.security.enabled=false" \

docker.elastic.co/elasticsearch/elasticsearch:8.17.6

```

```python

def elastic_search(query):

search_query = {

"size": 5,

"query": {

"bool": {

"must": {"multi_match": {"query": query, "fields": ["question^3", "text", "section"]}},

"filter": {"term": {"course": "data-engineering-zoomcamp"}}

```

```python

def query_llm(mod_prompt):

response = client.chat.completions.create(model='gpt-4o', messages=[{"role": "user", "content": mod_prompt}])

return response.choices[0].message.content

```

RAG 구현 팁: 외부 저장소(예: Elasticsearch)와 LLM(예: gpt-4o)을 결합해 정확한 답변 생성 가능
실무 적용 예시: "강의에 가입할 수 있나요?"와 같은 질문에 대해 Yes, you can still join the course와 같은 정확한 답변 생성
핵심: 검색 시스템과 LLM의 협업을 통해 최신 정보 기반의 정확한 답변 제공 가능