MS, 사람과 협업하는 차세대 웹 자동화 AI 에이전트 ‘마젠틱-UI’ 공개
카테고리
인공지능
서브카테고리
인공지능
대상자
- 소프트웨어 개발자, AI 연구자, 웹 개발자
- 난이도 높은 기술적 이해가 필요
핵심 요약
- 마젠틱-UI는 사용자와 실시간 협업을 지원하는 AI 에이전트로,
공동 기획
,공동 수행
,행동 보호
,계획 학습
기능을 제공 - 모듈화된 아키텍처(
Orchestrator
,WebSurfer
,Coder
,FileSurfer
)로 유연한 작업 흐름 구현 - GAIA 벤치마크에서 사용자 개입 시 성공률 71% 향상, 보안 강화를 위한 Docker 컨테이너 기반 실행
섹션별 세부 요약
1. 기존 AI 에이전트의 문제점
- 작업 과정 불투명성으로 인한 사용자 개입 기회 부족
- 결제 정보 입력, 코드 실행 시 치명적 오류 발생 가능성
- 자율성 강조로 인한 사용자 통제 배제 및 결과 예측 불가능성
2. 마젠틱-UI의 핵심 기능
- 공동 기획: AI의 계획을 사용자가 수정/삭제 가능
- 공동 수행: 작업 중 실시간 진행 상황 공유 및 단계별 중단/수정 가능
- 행동 보호: 브라우저 탭 닫기, 양식 제출 시 사용자 확인 절차 강화
- 계획 학습: 사용자 피드백을 통해 향후 작업 효율성 향상
3. 마젠틱-UI 아키텍처
Orchestrator
: 전체 작업 계획 수립 및 하위 에이전트 조율WebSurfer
: 웹 브라우저 조작(페이지 탐색, 클릭, 양식 입력)Coder
: 샌드박스 환경에서 코드 실행을 안전하게 처리FileSurfer
: 문서/데이터 분석 및 정보 추출 수행
4. 성능 및 사용자 참여 분석
- GAIA 벤치마크 테스트에서 사용자 개입 시 51.9% 성공률 달성(단독 30.3%)
- 복잡한 시뮬레이션 설정에서도 42.6% 성공률 상승
- 전체 작업 중 10%만 사용자 개입 필요, 평균 도움 요청 1.1회
5. 보안 및 확장성
- Docker 컨테이너 내 실행으로 사용자 자격 증명 노출 방지
- 사이트 접근 허용 목록 제한, 모든 행동 승인 확인 절차 구현
- 레드팀 테스트에서 피싱 공격 및 프롬프트 인젝션 차단 성공
결론
- 마젠틱-UI는 사용자 참여를 통한 적응형 작업 흐름 구현과 보안 강화를 통해 실무에서 유연한 웹 자동화 가능
- 오픈소스로 공개되어 GitHub 및 애저 AI 파운드리 랩스에서 활용 가능