EPL 2024/25 시즌 팀 성과 대시보드 개발 프로젝트 요약
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
데이터 분석
대상자
- 대상자: 데이터 분석가, 소프트웨어 개발자, 스포츠 분석에 관심 있는 사람들
- 난이도: 중급 (Python, pandas, Streamlit, Tableau 기초 지식 필요)
핵심 요약
- 데이터 처리:
pandas
를 사용해 홈/원정 경기 데이터를 분리하고groupby
로 팀별 통계 계산 (Win
,Draw
,GD
등) - 대시보드 도구: Streamlit (인터랙티브 웹 대시보드) + Tableau Public (시각적 분석 공유) 활용
- 핵심 기능: 팀별 홈/원정 기록 비교, 경기 평균 점수/득실점, 리그 순위 동적 업데이트
섹션별 세부 요약
1. 프로젝트 개요
- EPL 2024/25 시즌 팀 성과를 시각화하기 위한 개인 프로젝트
- 목표: 인터랙티브 대시보드로 홈/원정 성과, 점수 평균, 리그 순위 분석
- 데이터 출처: footballdata.co.uk 공개 자료
2. 데이터 처리 흐름
- 데이터 로드:
pd.read_csv("epl_team_summary.csv")
로 CSV 파일 불러오기 - 데이터 전처리:
- Date
열을 pd.to_datetime
으로 형식 변환
- 홈/원정 경기 데이터 분리 (home
/ away
DataFrame 생성)
- Win
, Draw
, Loss
칼럼 생성 (ex: home['Win'] = (home['FTR'] == 'H').astype(int)
)
- 통계 계산:
groupby('Team')
로GoalsFor
,GoalsAgainst
,Points
,GD
등 계산
3. 대시보드 구현
- Streamlit 대시보드:
- 링크
- 팀 선택 필터, 리그 테이블 정렬(점수, GD, 득점 순), 동적 시각화 제공
- Tableau Public 대시보드:
- 링크
- 시각적 분석과 공유 기능 강조
4. 기술적 고려사항
- 공유 제한: Power BI 대신 Streamlit과 Tableau Public 선택 (개인 계정 기반 공유 지원)
- 소스 코드 공개: GitHub 저장소 제공
결론
- 실무 팁:
pandas
의groupby
와agg
활용으로 데이터 통계 계산을 간소화하고, Streamlit과 Tableau Public의 협업을 통해 공유 가능한 대시보드 구축 가능 - 핵심 도구:
pandas
,Streamlit
,Tableau Public
을 사용해 실시간 분석 및 시각화를 구현할 수 있음