감독 학습: 마침내 이해한 개념
카테고리
데이터 과학/AI
서브카테고리
인공지능
대상자
- 초보 AI/머신러닝 학습자
- 기초 수준의 개념 이해 (예: 알고리즘 이름, 학습 방식, 실습 도구)
핵심 요약
- 감독 학습(Supervised Learning)은 레이블 데이터(labeled data)를 사용해 모델이 입력-출력 관계를 학습하는 방식
- 회귀(Regression)와 분류(Classification)가 핵심 문제 유형
- 회귀: 연속 값 예측 (예:
house_price
,traffic_speed
) - 분류: 카테고리 예측 (예:
spam/not spam
) - 최적화 기법(
Gradient Descent
,Cost Function
)과 과적합 방지(Regularization)가 핵심 알고리즘
섹션별 세부 요약
1. 소개
- Anshika(B.Tech 학생)가 Andrew Ng의 감독 학습 강의를 수료
- 감독 학습 정의: 레이블 데이터를 기반으로 모델이 새로운 입력에 대해 출력 예측
- 학습 목표: 알고리즘 이름, 개념, 실습 방법을 정리
2. 감독 학습의 두 가지 유형
- 회귀(Regression):
- 선형 회귀(Linear Regression) – 다중 변수 포함 (예:
y = θ₀ + θ₁x₁ + θ₂x₂
) - 비용 함수(Cost Function): 평균 제곱 오차(MSE)로 모델의 오류 측정
- 분류(Classification):
- 로지스틱 회귀(Logistic Regression) – 이진 분류 문제에 사용
3. 핵심 알고리즘과 개념
- 경사 하강법(Gradient Descent): 모델이 최적의 파라미터(θ)를 찾는 방식
- 과적합(Overfitting) vs 과소적합(Underfitting): 모델의 복잡성-정확성 균형 유지
- 정규화(L2 Regularization):
λ
파라미터를 통해 과적합 방지
4. 실습 도구와 방법
- Python, NumPy, Jupyter Notebook 활용
- 선형 회귀(Linear Regression)을 라이브러리 전에 직접 구현
- 그래디언트 하강법과 비용 함수 그래프 시각화
- 고난도 개념은 수작업 노트로 정리
5. 다음 단계
- 비감독 학습(Unsupervised Learning) 강의 이어가기
- 실제 데이터셋(예: 교통, 에너지)에 회귀 모델 적용
- 초보자용 튜토리얼 작성
결론
- 선형 회귀 직접 구현과 비용 함수 시각화가 실무에 유용
- 정규화(L2)를 통해 과적합 방지
- Jupyter Notebook과 수작업 노트를 활용한 학습 방식을 참고하세요!