개발 DevOps

D

dev_to

2025. 05. 21

Prometheus + Grafana: 시스템 모니터링 마스터하기

프로모etheus + 그라파나: 시스템 모니터링 마스터하기

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

DevOps

대상자

개발자, DevOps 엔지니어, 시스템 관리자에게 유용
난이도: 중간 (Prometheus 설정 및 PromQL 이해 필요)

핵심 요약

프로모etheus는 시스템 메트릭을 수집하고 저장하며, 그라파나는 이를 시각화하여 실시간 모니터링 가능
핵심 기능: PromQL을 사용한 메트릭 분석, Alertmanager 기반 경고 시스템, 모든 규모의 시스템에 적용 가능
실무 활용: Java/Spring Boot, Python 애플리케이션 모니터링 예제 포함, 실시간 오류 감지 및 비용 절감 효과

섹션별 세부 요약

1. 프로모etheus와 그라파나의 역할

프로모etheus: HTTP 엔드포인트를 통해 메트릭 수집, rate(http_requests_total[5m])과 같은 PromQL 쿼리로 분석
그라파나: Prometheus 데이터 소스 연결 후, 그래프, 게이지, 테이블 등으로 시각화
실시간 감지: CPU 사용률, API 응답 시간, 5xx 오류 비율 등 다양한 메트릭 추적 가능

2. Spring Boot 애플리케이션 모니터링 예제

의존성 설정: pom.xml에 Micrometer 추가
메트릭 수집: application.yml에서 /actuator/prometheus 엔드포인트 노출
프로모etheus 설정: prometheus.yml 파일에서 localhost:8080 타겟 지정 및 15초 스케이프 간격 설정

3. 그라파나 대시보드 생성

설치: grafana-server 실행 후 http://localhost:3000 접속
데이터소스 연결: Prometheus URL(http://localhost:9090) 설정
패널 구성: rate(payment_requests_total[5m]) 쿼리 사용, 시간 시리즈 그래프 시각화

4. 경고 시스템 구성

프로모etheus 경고 규칙: high_error_rate 경고 조건 설정 (rate(http_requests_total{status="500"}[5m]) > 0.01)
알림 전달: alertmanager.yml 파일에서 이메일 알림 설정 (admin@example.com 전송)

5. Python 애플리케이션 모니터링

커스텀 엑스포터: exporter.py 파일에서 /metrics 엔드포인트 노출
프로모etheus 수집: start_http_server(8000) 실행 후 메트릭 수집 가능

6. 도구 비교 및 선택

프로모etheus + 그라파나: 오픈소스, 유연한 커스터마이징, 비용 효율성 우수
New Relic/Datadog: 상용 제품, 사용자 친화적 UI, 가격 상승 추세

7. 위험 관리 및 최적화

메트릭 과부하: recording rules로 데이터 사전 집계
대시보드 혼잡: 관련 메트릭 그룹화, 간단한 시각화 사용
경고 오류: 시뮬레이션 테스트로 알림 기능 검증

결론

실무 팁: PromQL 최적화(sum(rate(metric[5m])) by (label))로 쿼리 지연 감소, 경고 규칙과 커스텀 엑스포터로 고급 모니터링 구현
핵심 이점: 실시간 오류 감지, 시스템 가용성 99.9% 달성, 비용 절감 및 유지보수 효율성 향상 가능
결론: 프로모etheus + 그라파나는 모든 규모의 시스템에 적합한 유연한 모니터링 솔루션으로, DevOps 역량 강화에 기여

Prometheus Grafana monitoring DevOps real-time insights time-series metrics open-source

목록으로 원문 보기