사카나, '뉴런' 아키텍처로 트랜스포머를 넘어선 단계별 사고 방식 공개

주제: 사카나, 트랜스포머를 넘어선 신경망 구조 "CTM" 공개

분류: 인공지능, 머신러닝

하위 분류: 인공지능, 머신러닝

대상 독자: AI 연구자, 딥러닝 엔지니어, 신경망 구조 개발자

핵심 요약

- CTM뇌의 신경망 구조를 모방하여, 시간 동기화와 자율적 활성화 메커니즘을 도입한 새로운 AI 모델이다.

- 각 뉴런은 스스로 활성화 타이밍을 결정하며, 외부 명령 없이도 협업을 자율적으로 결정한다.

- 단순한 문제는 빠르게, 복잡한 문제는 천천히 처리하는 유연한 연산 자원 분배 기능을 갖는다.

- ImageNet-1K 벤치마크에서 탑-1 정확도 72.47%, 탑-5 정확도 89.89%를 달성하며, 트랜스포머 모델보다는 낮지만 새로운 구조 실험에 초점을 맞춘 초기 모델로서 주목받고 있다.

각 부분의 상세 요약

1. CTM의 기초 원리

- 뇌의 신경망 구조를 모방하여, 시간 동기화자율적 활성화 메커니즘을 도입했다.

- 트랜스포머 모델과 달리, 시간 요소를 고려한 순차적 처리를 지원한다.

- 각 뉴런은 스스로 활성화 타이밍을 결정하며, 외부 명령 없이도 협업을 자율적으로 결정한다.

2. CTM의 구조적 특징

- 각 뉴런은 스스로 활성화 타이밍을 결정하며, 외부 명령 없이도 협업을 자율적으로 결정한다.

- 시간 동기화자율적 활성화 메커니즘을 통해, 신뢰도 조정문제 해결 효율성을 극대화한다.

- 내부 연산 과정에서 예측 신뢰도와 실제 정확도가 거의 일치하는 우수한 보정력을 구현했다.

3. 성능 평가 및 활용 사례

- ImageNet-1K 벤치마크에서 탑-1 정확도 72.47%, 탑-5 정확도 89.89%를 달성하며, 트랜스포머 모델보다는 낮지만 새로운 구조 실험에 초점을 맞춘 초기 모델로서 주목받고 있다.

- 미로 찾기 작업에서 위치 정보나 공간 임베딩 없이도 이미지로부터 방향을 단계별로 정확하게 도출해냈다.

- 시각 주의력 추적 결과에서는 눈에서 코, 입 순으로 시선 이동이라는 인간처럼 사고하는 특성이 관찰됐다.

결론

- CTM은 뇌의 신경망 구조를 모방하여, 시간 동기화와 자율적 활성화 메커니즘을 도입한 새로운 AI 모델이다.

- 단순한 문제는 빠르게, 복잡한 문제는 천천히 처리하는 유연한 연산 자원 분배 기능을 갖는다.

- ImageNet-1K 벤치마크에서 탑-1 정확도 72.47%, 탑-5 정확도 89.89%를 달성하며, 트랜스포머 모델보다는 낮지만 새로운 구조 실험에 초점을 맞춘 초기 모델로서 주목받고 있다.

- CTM의 코드는 GitHub에 공개되어 있어, AI 연구자 및 개발자들이 활용할 수 있다.