Apache Zeppelin을 활용한 Presto 쿼리 시각화 및 분석 실습 가이드

📅 2025-05-13T05:41:06Z 👤 Saurabh Mahawar 🏷️ 개발

완성도:

0.9

🤖 AI 추천

이 콘텐츠는 Presto를 사용하여 데이터 분석을 수행하려는 데이터 엔지니어, 데이터 과학자, 백엔드 개발자에게 매우 유용합니다. 특히, Apache Zeppelin이라는 인터랙티브 노트북 환경을 처음 접하거나 Presto와의 연동 및 활용 방법을 배우고 싶은 미들 레벨 이상의 개발자에게 실질적인 도움을 줄 수 있습니다.

🔖 주요 키워드

Presto Apache Zeppelin SQL 데이터 시각화 데이터 분석 JDBC 데이터 엔지니어링 빅데이터

Apache Zeppelin을 활용한 Presto 쿼리 시각화 및 분석 실습 가이드

핵심 기술

이 가이드는 Apache Zeppelin과 Presto를 연동하여 SQL 쿼리를 실행하고 데이터 시각화를 수행하는 방법을 단계별로 상세하게 안내합니다. 이를 통해 사용자는 Presto를 통한 대규모 데이터 분석 작업을 보다 인터랙티브하고 직관적으로 수행할 수 있습니다.

기술적 세부사항

Presto 설치: 이전 글에서 다루어진 Presto 설치를 전제로 합니다.
Apache Zeppelin 설치: 공식 다운로드 페이지에서 최신 버전을 다운로드 받아 압축 해제합니다.
Zeppelin 설정:
- zeppelin-env.sh: Hadoop/Spark 사용 여부 설정을 위해 export USE_HADOOP=false 추가.
- zeppelin-site.xml: Presto와 충돌하는 기본 포트(8080)를 다른 포트(예: 8888)로 변경.
Zeppelin 실행 및 관리: bin/zeppelin-daemon.sh start, status, stop 명령어를 사용한 서비스 제어.
Presto JDBC 드라이버 준비: Presto JDBC 드라이버 JAR 파일을 다운로드하여 Zeppelin의 interpreter/jdbc 디렉토리에 복사.
Zeppelin 인터프리터 설정:
- localhost:8888 접속 후 "Interpreter" 탭에서 "+ Create" 클릭.
- Interpreter Name: presto
- Interpreter Group: jdbc
- Properties 설정: default.url, default.user, default.driver (com.facebook.presto.jdbc.PrestoDriver).
Presto 쿼리 실행: 새 노트북 생성 시 "Default Interpreter"를 presto로 선택하고 %presto Show CATALOGs;와 같은 SQL 쿼리 실행.