We Built an AI That "Daydreams": Our Google Cloud Hackathon Story
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능
대상자
- 소프트웨어 개발자, AI 엔지니어, DevOps 엔지니어
- 난이도: 중급 이상 (AI 모델 연동, 커스텀 프레임워크 구축 기술 필요)
핵심 요약
DaydreamAgent
를 통해 AI의 "내면의 삶"을 구현하여 주동적인 대화 참여 가능- Cognitive Lenses (예:
Analytical Lens
,Imaginative Lens
)로 다양한 사고 방식을 지원 - SageMind Architecture를 기반으로 커스텀 라이트급 에이전트 프레임워크 구축 (Python, Gemini 1.5 Pro/Flash 활용)
섹션별 세부 요약
1. 문제 정의 및 목표
- 현대 AI의 "패시브" 특성 (예: 대화 시작 시까지 기다림)을 해결하고자 함
- Wise라는 이름의 AI를 개발하여 "공동 창작자" 역할 수행
- 사용자 사고 흐름을 이해하고 자발적인 대화 참여를 유도
2. 핵심 개념
DaydreamAgent
- 데이터셋 분석을 통해 이상치 탐지 후 자연어 '스파크' 생성
- 예: 주식 거래량 최고일 데이터로 자연어 인사이트 제공
- Cognitive Lenses
Analytical Lens
: Gemini 1.5 Pro로 실시간 Python 코드 생성 및 Plotly 그래프 생성Imaginative Lens
: 창의적 글쓰기 및 시 생성
3. 기술적 구현
- 프레임워크
- Streamlit을 기반으로 사용자 인터페이스 구축
- Python, Pandas, Plotly로 에이전트 핵심 로직 구현
- AI 모델
- Gemini 1.5 Pro (분석 모드), Gemini 1.5 Flash (일반 모드)
- 배포
- Docker와 Google Cloud Run으로 클라우드 배포
4. 미래 계획
- Mind Map 시각화 도구 추가 (사고 흐름 시각화)
- Multimodal Conductor로 발전: Google BigQuery 연동, 웹 검색 툴 통합, 멀티모달 모델 활용
결론
- 자율적 에이전트 프레임워크 구축 시 Gemini 1.5 Pro/Flash와 Streamlit의 조합이 효과적
- Cognitive Lenses를 통해 AI의 다양한 사고 방식을 구현하는 것이 핵심
- 커스텀 프레임워크는 AI 모델 연동과 확장성을 높이는 데 유리
- SageMind Architecture는 미래 AI 시스템의 기초로 활용 가능