PostgreSQL의 LIKE '%...' 및 OFFSET 성능 저하, Elasticsearch 도입으로 22초 → 2초 개선기

📅 2025-07-15T08:04:44.912197 👤 Hunn 🏷️ 개발, 트렌드

완성도:

0.9

🤖 AI 추천

대규모 데이터베이스에서 검색 성능 저하를 겪고 있거나, Elasticsearch 도입을 고려 중인 백엔드 개발자 및 데이터베이스 관리자에게 강력히 추천합니다.

🔖 주요 키워드

PostgreSQL Elasticsearch 성능 최적화 LIKE '%...%'OFFSET DB 성능 하이브리드 아키텍처 페이징 데이터 마이그레이션 SQL 최적화

PostgreSQL의 LIKE '%...' 및 OFFSET 성능 저하, Elasticsearch 도입으로 22초 → 2초 개선기

핵심 기술

본 콘텐츠는 PostgreSQL에서 LIKE '%검색어%' 패턴과 OFFSET으로 인해 발생하는 극심한 성능 저하 문제를 진단하고, 이를 해결하기 위해 Elasticsearch를 도입한 실제 경험을 공유합니다. 대용량 데이터 처리 시 발생하는 병목 현상과 해결 과정을 상세히 다룹니다.

기술적 세부사항

문제 정의: 2,260만 건의 대용량 데이터에서 LIKE '%검색어%'와 OFFSET 조합으로 인한 마지막 페이지 조회 시 20초 이상 소요되는 성능 저하.
원인 분석:
- LIKE '%검색어%': PostgreSQL의 B-Tree 인덱스가 무용지물이 되어 전체 테이블 스캔(Full Table Scan) 발생.
- OFFSET N: N개의 데이터를 읽고 버리는 비효율적인 처리로 인한 성능 저하.
해결책: Elasticsearch 도입을 통한 하이브리드 아키텍처 설계.
- 아키텍처: 마스터 데이터는 PostgreSQL에서 관리, 검색 기능은 Elasticsearch 전담.
- 데이터 모델링: PostgreSQL 테이블 구조를 Elasticsearch Document로 매핑 (Spring Data Elasticsearch 활용).
- 데이터 마이그레이션: 50,000건씩 배치 처리 방식으로 2,260만 건 데이터 마이그레이션.
- 검색 쿼리 최적화: PostgreSQL의 LIKE '%...%'를 Elasticsearch의 wildcard 쿼리로 대체.
- Deep Pagination 해결: Elasticsearch max_result_window 설정으로 1000만 건까지 페이지 번호 확장.
결과: 검색 조건 + 마지막 페이지 조회 시 22.4초 → 2.9초로 86% 성능 개선 (거의 일정한 응답 속도 유지).
프로파일링: Elasticsearch 쿼리 실행 시간 0.012초 (기존 대비 1600배 속도 향상).