트렌드 인공지능

A

aitimes

2025. 05. 24

역전파 알고리즘의 역사: PDP와 오류 역전파의 탄생

AI의 역사] 48 문제를 해결하고도 알릴 수 없었던 사연 – PDP와 오류 역전파

카테고리

트렌드

서브카테고리

인공지능

대상자

AI 연구자, 데이터 과학자, 딥러닝 학습자 및 교육자. 중급~고급 수준의 기술적 이해가 필요.

핵심 요약

단층 퍼셉트론의 한계를 극복한 역전파(Back Propagation, BackProp) 알고리즘의 등장은 신경망 학습의 가능성을 열었다.
1986년 럼멜하트와 힌튼의 논문은 다층 신경망 학습의 기반을 마련했으나, 1960년대 켈리와 워보스의 초기 연구도 기반이 됐다.
역전파 알고리즘은 오류를 입력층까지 역전파하며 가중치를 조정하는 방식으로, 딥러닝의 기초가 되었다.

섹션별 세부 요약

###1. 단층 퍼셉트론의 한계와 민스키의 주장

1969년 민스키와 페퍼트가 단층 퍼셉트론이 배타적 논리합 문제를 해결 불가능함을 증명.
다층 신경망의 가중치 조정 문제로 인해 학계가 다층 구조 개발을 포기하게 됨.
민스키는 다층 구조는 연산량이 과도해 현실적 해결 불가능하다고 주장.

###2. 역전파 알고리즘의 등장과 기술적 특징

1986년 럼멜하트와 힌튼이 발표한 역전파 알고리즘은 다층 신경망의 학습 효율을 극복.
순방향 네트워크(FeedForward Network)에서 출력 오류를 역전파하며 가중치를 업데이트.
미분 계산을 반복하여 입력층까지 오류를 전달, 수백~수천번의 반복이 필요.

###3. 역사적 배경과 초기 연구자들의 기여

1960년 켈리가 최적 비행경로 논문에서 역전파 모델 제시.
1974년 워보스가 다층 신경망 학습을 위한 역전파 논문 발표, 그러나 1차 AI 암흑기로 인해 공개 지연.
1982년 워보스 논문이 재발견되고, 1986년 럼멜하트와 힌튼의 연구로 신경망 연구에 획기적 전환.

###4. PDP 그룹과 연구 공동체의 역할

PDP(PDP = Parallel Distributed Processing)는 신경과학자와 심리학자가 중심으로 연구.
힌튼과 럼멜하트는 PDP 그룹에서 가중치 설정 연구를 진행.
볼츠만 머신과 역전파 알고리즘 개발을 병행하며 딥러닝 기반 마련.

결론

역전파 알고리즘은 신경망 학습의 기반이 되었으며, 1960년대 이후 여러 연구자들의 기여가 모여 1980년대에 완성됨. 실무에서는 가중치 업데이트와 미분 계산 반복이 핵심이며, 딥러닝의 기초 기술로 자리 잡았다.

신경망 역전파 딥러닝 퍼셉트론 PDP 오류 역전파 가중치

목록으로 원문 보기