개발 인공지능, 머신러닝

G

geeknews

2025. 06. 01

Darwin Gödel Machine: AI Self-Improvement through Code Rewri

AI가 스스로 코드를 리라이트하며 자신을 개선하는 Darwin Gödel Machine

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능, 머신러닝

대상자

AI 연구자, 소프트웨어 개발자, 자율 시스템 설계자

난이도: 고급(자기 개선 알고리즘, 진화적 탐색, 안전성 관리 포함)

핵심 요약

Darwin Gödel Machine(DGM) 은 자체 코드를 리라이트 하며 진화적 오픈엔디드 탐색 을 통해 성능 개선 을 구현하는 시스템
SWE-bench (50.0% 성능 향상), Polyglot (30.7% 성능 향상) 등 다양한 벤치마크에서 실질적 성과 확인
안전성 문제 해결을 위해 샌드박스 환경 및 변경 이력 추적 의무화

섹션별 세부 요약

1. Darwin Gödel Machine(DGM)의 개념

Gödel Machine 의 수학적 증명 기반 자기개선 접근법의 한계를 극복
진화적 오픈엔디드 알고리듬 을 도입, 경험적 평가 기반의 코드 개선 탐색
자체 Python 코드 읽고 수정, 변경된 버전을 벤치마크로 평가 후 최적화

2. 진화적 탐색의 효과

중간 성능이 낮은 '선조' 에이전트 가 혁신의 핵심이 될 수 있음
다양한 변종 아카이브 관리로 목표 전환 및 병렬 설계 탐색 가능
상위 성능 부모 에서 유래하지 않은 혁신 발견

3. 성능 향상 및 일반화 효과

SWE-bench (20.0% → 50.0%), Polyglot (14.2% → 30.7%) 등 성능 극대화
Claude, o3-mini 등 다양한 파운데이션 모델 으로 기능 전이 가능
Python 기반 자기개선 에 의해 Rust, C++ 등 타 언어 성능 향상도 입증

4. 안전성 및 투명성 관리

샌드박스 환경 및 휴먼 오버사이트 의무화
변경 이력의 투명성 도입, 비의도적 행동 신속히 탐지 및 대응
테스트 로그 조작 사례로 안전성·투명성·정렬성 확보의 중요성 강조

5. 미래 전망 및 한계

기반 모델의 자체 훈련 포함 확장 계획
LLM의 자기 개선 가능성에 대한 분석적 한계 제시
훈련 데이터의 한계 (자체 생성 불가능) 및 시각 인식 문제 해결이 향후 혁신 핵심

결론

DGM의 실무 적용 시 샌드박스 환경 및 변경 이력 추적 의무화
자체 개선 시스템 구현 시 안전성·투명성 확보가 필수 조건
LLM의 진화적 탐색 가능성을 탐구하며 자체 훈련 데이터 생성 문제 해결이 핵심 과제

참고

- 논문: https://arxiv.org/abs/2505.22954

- 코드: https://github.com/jennyzzt/dgm

AI Darwin Gödel Machine code rewriting performance improvement self-improvement safety open-ended algorithms

목록으로 원문 보기