개발 인공지능

A

aitimes

2025. 05. 24

OpenAI의 o3 모델로 AI 오퍼레이터 성능 5~15% 향상

오픈AI, AI 에이전트 '오퍼레이터' o3 모델로 성능 대폭 향상

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

AI 개발자, 연구자, 기업 기술 담당자*
난이도: 중급 이상 (모델 성능 평가, AI 에이전트 활용 사례 분석)*

핵심 요약

o3 모델 적용으로 오퍼레이터 성능 대폭 향상
OSWorld, WebArena, GAIA 지표에서 GPT-4o 대비 5~15% 성능 개선
복잡한 지시 처리 및 다단계 작업 수행 시 o3 모델 우수성 확인

섹션별 세부 요약

1. 모델 업그레이드 및 기능 개요

오퍼레이터는 웹 브라우저 기반 작업 자동화를 수행하는 CUA(Computer Use Agent)
o3 모델은 추론 중심으로 설계되어 복잡한 지시 처리 및 브라우저 상호작용 향상
자체 클라우드 기반 가상 브라우저 환경(operator.chatgpt.com)에서 동작하며 보안 기능(감시 모드, 고위험 사이트 제한) 제공

2. 성능 향상 사례 및 지표

식당 예약 처리 시 데이터 정리 및 표 형태 제공 (이전 버전 대비 정보량 및 구조화 향상)
OSWorld 지표: o3 42.9점 → GPT-4o 38.1점 (실제 성능 차이 최대 20포인트 예상)
WebArena 지표: o3 62.9점 → GPT-4o 48.1점 (25% 이상 차이)
GAIA 지표: o3 62.2점 → GPT-4o 12.3점 (5배 이상 성능 차이)

3. 사용자 피드백 및 활용 제한

스타일, 응답 구조화, 지시 이행 능력에서 o3 버전 우위 확인
현재 연구 미리보기 상태로 일반 사용자 제공 X, Responses API는 GPT-4o 유지
향후 일반 소비자 및 기업 확장 계획 발표

결론

o3 모델 기반 오퍼레이터는 복잡한 작업 처리 및 지시 이행에서 뛰어난 성능을 보여, AI 에이전트 분야에서의 잠재력 강조
현재는 연구자 대상으로 제공되며, 일반화 전까지 성능 개선 및 안정성 확보가 필수적

오픈AI AI 에이전트 오퍼레이터 o3 성능 강화 추론 모델 GPT-4o

목록으로 원문 보기