데이터 웨어하우징 및 데이터 마이닝 MCQ 요약
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
데이터 분석
대상자
데이터 웨어하우징 및 데이터 마이닝을 학습하는 대학원생 및 B.Tech 학생. 중간 난이도의 개념 이해 및 실무 적용에 초점.
핵심 요약
- 데이터 웨어하우징의 핵심 특성:
시간 변동성
,주제 중심
,통합성
(예:time-varying
,subject-oriented
,integrated
). - 데이터 마이닝 기술:
K-means
는유럽 기하 거리
를 사용,Association Rule
은Support
와Confidence
로 평가. - 데이터 웨어하우징의 목적:
결정 지원 시스템(DSS)
을 위한 분석 및 예측.
섹션별 세부 요약
1. 데이터 웨어하우징의 시간 변동성
- 데이터 웨어하우징은
시간 요소
를 통해 역사적 맥락을 포함. time-varying
은 구조 내 암시적/명시적 시간 요소로 정의.
2. 데이터 웨어하우징의 통합성
- 다중 출처의 데이터를 통합하여
일관된 시스템
구축. 비즈니스 주제 중심
으로 데이터를 조직.
3. 데이터 마이닝 기술
K-means
는유럽 기하 거리
로 클러스터 중심과 데이터 포인트의 유사도 측정.Association Rule
은Support
와Confidence
로 규칙의 강도 및 흥미를 평가.
4. 예측 및 설명적 데이터 마이닝
Classification
은 예측적,Clustering
은 설명적.Web Usage Mining
은 사용자 액세스 패턴 분석에 사용.
5. 데이터 웨어하우징 아키텍처
- 아키텍처는 설계 및 구현의
구조적 프레임워크
제공. Metadata
는 데이터에 대한 설명 정보를 정의.
결론
- 핵심 팁: 데이터 웨어하우징의 4대 특성(
주제 중심
,시간 변동성
,통합성
,비휘발성
)을 이해하고, 데이터 마이닝 기법(K-means
,Association Rule
)의 수학적 기반을 익히는 것이 실무에 유리.