역전파 알고리즘의 역사: PDP와 오류 역전파의 탄생
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

AI의 역사] 48 문제를 해결하고도 알릴 수 없었던 사연 – PDP와 오류 역전파

카테고리

트렌드

서브카테고리

인공지능

대상자

AI 연구자, 데이터 과학자, 딥러닝 학습자 및 교육자. 중급~고급 수준의 기술적 이해가 필요.

핵심 요약

  • 단층 퍼셉트론의 한계를 극복한 역전파(Back Propagation, BackProp) 알고리즘의 등장은 신경망 학습의 가능성을 열었다.
  • 1986년 럼멜하트와 힌튼의 논문은 다층 신경망 학습의 기반을 마련했으나, 1960년대 켈리와 워보스의 초기 연구도 기반이 됐다.
  • 역전파 알고리즘은 오류를 입력층까지 역전파하며 가중치를 조정하는 방식으로, 딥러닝의 기초가 되었다.

섹션별 세부 요약

###1. 단층 퍼셉트론의 한계와 민스키의 주장

  • 1969년 민스키와 페퍼트가 단층 퍼셉트론이 배타적 논리합 문제를 해결 불가능함을 증명.
  • 다층 신경망의 가중치 조정 문제로 인해 학계가 다층 구조 개발을 포기하게 됨.
  • 민스키는 다층 구조는 연산량이 과도해 현실적 해결 불가능하다고 주장.

###2. 역전파 알고리즘의 등장과 기술적 특징

  • 1986년 럼멜하트와 힌튼이 발표한 역전파 알고리즘은 다층 신경망의 학습 효율을 극복.
  • 순방향 네트워크(FeedForward Network)에서 출력 오류를 역전파하며 가중치를 업데이트.
  • 미분 계산을 반복하여 입력층까지 오류를 전달, 수백~수천번의 반복이 필요.

###3. 역사적 배경과 초기 연구자들의 기여

  • 1960년 켈리가 최적 비행경로 논문에서 역전파 모델 제시.
  • 1974년 워보스가 다층 신경망 학습을 위한 역전파 논문 발표, 그러나 1차 AI 암흑기로 인해 공개 지연.
  • 1982년 워보스 논문이 재발견되고, 1986년 럼멜하트와 힌튼의 연구로 신경망 연구에 획기적 전환.

###4. PDP 그룹과 연구 공동체의 역할

  • PDP(PDP = Parallel Distributed Processing)는 신경과학자와 심리학자가 중심으로 연구.
  • 힌튼과 럼멜하트는 PDP 그룹에서 가중치 설정 연구를 진행.
  • 볼츠만 머신역전파 알고리즘 개발을 병행하며 딥러닝 기반 마련.

결론

  • 역전파 알고리즘은 신경망 학습의 기반이 되었으며, 1960년대 이후 여러 연구자들의 기여가 모여 1980년대에 완성됨. 실무에서는 가중치 업데이트와 미분 계산 반복이 핵심이며, 딥러닝의 기초 기술로 자리 잡았다.