개발 인공지능

A

aitimes

2025. 06. 16

MS, 대규모 시스템 디버깅용 '추론 에이전트' 출시

MS, 대규모 시스템 디버깅용 '추론 에이전트' 출시

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

소프트웨어 개발자, DevOps 엔지니어
난이도: 중급 이상 (AI 에이전트와 대규모 시스템 디버깅 기술 이해 필요)

핵심 요약

Code Researcher는 대규모 시스템에서 발생하는 충돌 문제를 자동화된 방식으로 해결하는 AI 에이전트
3단계 전략(Analysis → Synthesis → Validation)을 통해 58%의 충돌 해결률 달성 (SWE-Agent 대비 20.5% 상승)
o1 추론 모델을 활용한 생성 단계에서도 동일한 성능 유지, 컨텍스트 이해와 추론 능력이 핵심 요소

섹션별 세부 요약

1. 문제 정의 및 배경

대규모 시스템 코드는 수천 개의 파일 간 복잡한 의존성으로 인해 소소한 변경으로도 예기치 못한 오류 발생 가능
저수준 시스템 코드(운영체제, 네트워크 스택)는 충돌 보고서, 스택 트레이스 등 자연어 힌트 부족으로 자동화 디버깅이 어려움
기존 SWE-Agent의 37.5% 해결률에 비해 Code Researcher는 58% 달성

2. Code Researcher의 작동 방식

3단계 전략:
Analysis: 충돌 보고서 기반으로 심볼 정의 검색, 정규 표현식 패턴 탐색, 커밋 기록 분석 등 다양한 도구 활용
Synthesis: 10개 파일 분석 후 결함 가능성이 있는 코드 조각 식별 및 패치 생성
Validation: 자동 테스트 도구로 생성된 패치 검증, 검증된 패치만 최종 결과로 제공

3. 성능 검증 및 결과

리눅스 커널 충돌 사례 279건 대상 테스트에서 GPT-4o 모델과 o1 추론 모델 모두 58% 해결률
SWE-Agent 대비 20.5% 성능 향상, 평균 탐색 경로당 분석 파일 수 10개 vs. 1.33개
FFmpeg 프로젝트에서 10건 중 7건 해결으로 커널 외 영역에서도 확장성 검증

결론

대규모 시스템 디버깅 시 Code Researcher 사용 권장 (자동화, 고성능, 확장성)
추론 중심 모델(o1)의 활용은 디버깅 성능 향상에 핵심 요소
향후 자율 리서치 에이전트(Research Agent)로의 진화 가능성 제시

추론 에이전트 코드 리서처 대규모 시스템 디버깅 인공지능(AI) AI 에이전트 코드 분석

목록으로 원문 보기