AI 에이전트의 핵심 원리와 구조
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능
대상자
- 프로젝트 개발자, AI 연구자, 소프트웨어 엔지니어
- 중간 수준의 기술 이해도를 가진 개발자
핵심 요약
- AI 에이전트의 핵심 역할:
Perceive
→Reason
→Act
→Learn
의 4단계 프로세스 - LLM의 역할:
Large Language Model
(예: GPT-4, Claude)는thought
생성,plan
수립,language generation
수행 - Tool 활용 필수: 외부 API(
get_weather
,database query
)를 통해real-world action
수행 - ReAct 프레임워크:
Reasoning + Acting
병렬 처리로 정확도 향상
섹션별 세부 요약
1. AI 에이전트 정의
- 4가지 핵심 능력: 환경 인식, 추론, 외부 도구 사용, 학습/적응
- LLM의 역할: 언어 모델은 에이전트의 "뇌" 역할 수행 (지시사항 이해 → 생각 생성 → 행동 결정)
- 제한 사항: 실시간 정보 접근 불가, 외부 시스템 조작 불가 → Tool 사용 필수
2. LLM 기반 에이전트 구조
- LLM의 학습 방식: 대규모 텍스트 기반
token prediction
- 예시: GPT-4는
reasoning
,planning
,language generation
수행 - 제한: 외부 시스템과의 상호작용 불가 → Tool 호출 필요
3. Tool 활용 방식
- Tool의 주요 기능:
- 웹 검색
- 데이터베이스 쿼리
- 날씨/주식 정보 조회
- 코드 실행
- 예시:
{"action":"get_weather","input":"India"}
- Tool 호출 결과:
Observation: It's 27°C and sunny in Tokyo
4. 메시지 및 토큰 구조
- 메시지 역할:
system
: 에이전트 행동 지시 ("You are an AI agent that can use tools."
)user
: 인간 또는 앱의 입력 ("What’s the weather in Tokyo?"
)assistant
: LLM의 응답 ("Action: get_weather, Input: Tokyo"
)tool
: 외부 도구 결과 ("Observation: It's 27°C and sunny in Tokyo."
)- 프레임워크별 구분자:
<|thought|>
,<|action|>
,<|observation|>
사용
5. ReAct 프레임워크
- 원리:
Reasoning
과Acting
병렬 처리 - 예시:
- Thought: "10km → miles 변환 필요"
- Action:
unit conversion tool
호출 - Observation: "10km ≈ 6.21 miles"
- Response: "10km ≈ 6.21 miles"
- 효과: 단계별 실행 → 정확도 향상
6. 에이전트의 학습 및 적응
- Observation 분석: 환경 피드백으로 다음 행동 결정
- 실행 예시:
- API 호출 → 시스템 명령 실행 → 메시지 전송 → 기록 업데이트
- 동적 특성: 피드백을 통해 자율적 학습 수행
결론
- 실무 적용 팁:
ReAct
프레임워크 사용 시Reasoning
과Acting
병렬 처리 권장Tool
호출 결과(Observation
)를 기반으로 에이전트의 학습/적응 설계- 예:
get_weather
API 호출 시Observation
데이터를 기반으로 다음 단계 결정 - 핵심 메시지: LLM은
think
만 수행 →Tool
을 통해real-world action
수행해야 에이전트의 자율성 확보 가능