Apache Zeppelin을 활용한 Presto 쿼리 시각화 및 분석 실습 가이드
🤖 AI 추천
이 콘텐츠는 Presto를 사용하여 데이터 분석을 수행하려는 데이터 엔지니어, 데이터 과학자, 백엔드 개발자에게 매우 유용합니다. 특히, Apache Zeppelin이라는 인터랙티브 노트북 환경을 처음 접하거나 Presto와의 연동 및 활용 방법을 배우고 싶은 미들 레벨 이상의 개발자에게 실질적인 도움을 줄 수 있습니다.
🔖 주요 키워드

핵심 기술
이 가이드는 Apache Zeppelin과 Presto를 연동하여 SQL 쿼리를 실행하고 데이터 시각화를 수행하는 방법을 단계별로 상세하게 안내합니다. 이를 통해 사용자는 Presto를 통한 대규모 데이터 분석 작업을 보다 인터랙티브하고 직관적으로 수행할 수 있습니다.
기술적 세부사항
- Presto 설치: 이전 글에서 다루어진 Presto 설치를 전제로 합니다.
- Apache Zeppelin 설치: 공식 다운로드 페이지에서 최신 버전을 다운로드 받아 압축 해제합니다.
- Zeppelin 설정:
zeppelin-env.sh
: Hadoop/Spark 사용 여부 설정을 위해export USE_HADOOP=false
추가.zeppelin-site.xml
: Presto와 충돌하는 기본 포트(8080)를 다른 포트(예: 8888)로 변경.
- Zeppelin 실행 및 관리:
bin/zeppelin-daemon.sh start
,status
,stop
명령어를 사용한 서비스 제어. - Presto JDBC 드라이버 준비: Presto JDBC 드라이버 JAR 파일을 다운로드하여 Zeppelin의
interpreter/jdbc
디렉토리에 복사. - Zeppelin 인터프리터 설정:
localhost:8888
접속 후 "Interpreter" 탭에서 "+ Create" 클릭.- Interpreter Name:
presto
- Interpreter Group:
jdbc
- Properties 설정:
default.url
,default.user
,default.driver
(com.facebook.presto.jdbc.PrestoDriver
).
- Presto 쿼리 실행: 새 노트북 생성 시 "Default Interpreter"를
presto
로 선택하고%presto Show CATALOGs;
와 같은 SQL 쿼리 실행.
개발 임팩트
Apache Zeppelin을 통해 Presto 쿼리 결과를 시각화하여 데이터 탐색 및 분석 효율성을 크게 향상시킬 수 있습니다. 다양한 시각화 옵션을 활용하여 복잡한 데이터를 이해하기 쉽게 표현하고, 팀원들과의 데이터 기반 협업을 강화할 수 있습니다.
커뮤니티 반응
(본문 내용에 커뮤니티 반응에 대한 직접적인 언급은 없으나, Presto 및 Apache Zeppelin은 활발한 오픈소스 커뮤니티를 가지고 있어 기술 활용 및 문제 해결에 용이함을 시사합니다.)
📚 관련 자료
incubator-zeppelin
Apache Zeppelin의 공식 GitHub 저장소로, 프로젝트의 최신 버전, 소스 코드, 이슈 트래킹, 기여 가이드라인 등을 포함하고 있어 가이드에서 설명하는 Zeppelin 설치 및 설정과 직접적인 관련이 있습니다.
관련도: 95%
prestosql/presto
Presto SQL (현 Trino)의 공식 GitHub 저장소입니다. Presto의 아키텍처, 기능, JDBC 드라이버 구현 등에 대한 정보를 제공하며, 가이드에서 Presto와 연동하는 데 필요한 기반 지식을 얻을 수 있습니다.
관련도: 90%
trino-jdbc
Trino (Presto의 포크)의 JDBC 드라이버 관련 정보를 제공하는 저장소입니다. Presto와 Trino는 유사한 아키텍처를 공유하므로, JDBC 드라이버의 사용법이나 구성에 대한 정보를 참고하여 가이드의 Presto JDBC 드라이버 설정을 이해하는 데 도움이 될 수 있습니다.
관련도: 85%