몽골의 모든 유르트/게르 수를 머신러닝으로 세어보기
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
데이터 분석
대상자
데이터 과학자, 머신러닝 개발자, 도시 계획자, 사회 문제 분석가
핵심 요약
- YOLO11 모델을 활용해 위성 이미지에서 17만 2,689개의 유르트를 탐지하여 몽골의 주거 인프라 문제를 분석
- Docker Swarm, FastAPI를 기반으로 128 vCPU 규모의 클러스터를 구성하여 대규모 이미지 처리 자동화
- 라벨링-재학습 반복 피드백 루프를 통해 40% 이상의 탐지 정확도 달성
섹션별 세부 요약
###1. 프로젝트 개요
- YOLO11 모델을 사용해 단일 위성 이미지에서 유르트를 식별
- Google Maps에서 256x256 픽셀 타일 형태의 위성 이미지를 자동 수집
- Label Studio를 통해 유르트 라벨링 데이터셋 생성
###2. 데이터 수집 및 라벨링
- overpass turbo를 이용해 인구 밀집 지역 포인트 추출
- 2km 버퍼 기준으로 타일 집합 축소
- vast.ai GPU 리소스를 활용한 대규모 모델 훈련 및 S3 저장소 자동 업로드
###3. 모델 훈련 및 최적화
- 반복적 라벨링 및 샘플 확대를 통해 검출률 향상
- YOLO11 기반의 객체 검출 모델을 사용, 40% 이상의 예측 점수 기준으로 유르트 탐지
###4. 인프라 구축 및 처리
- Docker Swarm으로 8대 서버(128 vCPU) 클러스터 구성
- FastAPI 기반 API 서버와 워커 역할 분리
- 27만 개 검색 영역 대규모 병렬 처리
###5. 결과 및 사회적 통찰
- 17만 2,689개 유르트 탐지 결과, 주거 인프라 문제와 게르 지구 발전 과제 제시
- 2002년 토지 소유권 법 도입 이후 게르 지구의 법적 공식화 진행
- 울란바토르 2020 마스터플랜 재개발 정책 수립 필요성 강조
###6. 도전 과제 및 고려사항
- OSM 데이터 활용 시 타일 경계 오류 및 라이선스 문제 발생 가능성
- 구글맵 이미지 수집 시 이용약관 위반 가능성, 대체 이미지 소스 필요
- 오탐지 비율 및 비유르트 오브젝트(예: 저장 탱크) 분류 문제
결론
- YOLO11, Docker Swarm, FastAPI의 조합으로 대규모 위성 이미지 처리 자동화 가능
- 40% 이상의 탐지 정확도 달성 시 사회 문제 분석에 실질적 기여 가능
- OSM 데이터와 구글맵 이미지의 법적/기술적 제약을 고려한 다중 데이터 소스 활용 필요
- 게르 지구의 사회적 배경과 도시화 과제를 데이터 기반으로 정책 수립해야 함