Enhancing RAG Precision Using Bedrock Metadata
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능
대상자
- AWS Bedrock을 활용한 RAG 시스템 개발자 및 데이터 과학자
- 중급~고급 수준의 실무 경험이 필요한 분야
핵심 요약
- 메타데이터 필터를 사용하여 RAG 검색 정확도를 극대화할 수 있음
.metadata.json
파일 생성을 통해 문서의 대상층(예: 고등학교/대학)을 구분- Bedrock 쿼리 시 메타데이터 필터 적용으로 불필요한 문서 제외 가능
섹션별 세부 요약
1. 문제 정의
- 고등학교/대학용 교과서와 같은 유사한 주제 문서가 존재할 경우, 대상층에 맞지 않는 정보 검색 발생
- RAG 시스템의 검색 정확도 저하 및 불필요한 결과 반환 문제 발생
2. 메타데이터 필터 적용
metadataAttributes
속성을 사용하여 문서에 대상층 정보(예:level
:"college"
) 추가- S3 버킷에
.metadata.json
파일 업로드 후 Knowledge Base 동기화 실행
3. 구현 단계
- 문서별
.metadata.json
파일 생성 (예:college-book.pdf.metadata.json
) - Bedrock 쿼리 시
level
:"high-school"
과 같은 메타데이터 필터 적용 - "Test Knowledge Base" 기능을 통해 필터 적용 상태 검증 가능
4. 검증 및 테스트
- "Manual filters" 옵션 선택 후 메타데이터 필터 조건 입력
- 검색 결과에서 해당 메타데이터만 포함된 문서만 반환 확인
결론
- 메타데이터 필터는 RAG 시스템의 검색 정확도와 효율성을 극대화하는 핵심 전략
.metadata.json
파일 생성과 Bedrock 쿼리 시 필터 적용이 필수 단계- S3 동기화 및 테스트 기능 활용으로 필터가 올바르게 작동하는지 검증할 것