DaydreamAgent: Google Cloud Hackathon AI 개발 이야기
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

We Built an AI That "Daydreams": Our Google Cloud Hackathon Story

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

  • 소프트웨어 개발자, AI 엔지니어, DevOps 엔지니어
  • 난이도: 중급 이상 (AI 모델 연동, 커스텀 프레임워크 구축 기술 필요)

핵심 요약

  • DaydreamAgent를 통해 AI의 "내면의 삶"을 구현하여 주동적인 대화 참여 가능
  • Cognitive Lenses (예: Analytical Lens, Imaginative Lens)로 다양한 사고 방식을 지원
  • SageMind Architecture를 기반으로 커스텀 라이트급 에이전트 프레임워크 구축 (Python, Gemini 1.5 Pro/Flash 활용)

섹션별 세부 요약

1. 문제 정의 및 목표

  • 현대 AI의 "패시브" 특성 (예: 대화 시작 시까지 기다림)을 해결하고자 함
  • Wise라는 이름의 AI를 개발하여 "공동 창작자" 역할 수행
  • 사용자 사고 흐름을 이해하고 자발적인 대화 참여를 유도

2. 핵심 개념

  • DaydreamAgent
  • 데이터셋 분석을 통해 이상치 탐지 후 자연어 '스파크' 생성
  • 예: 주식 거래량 최고일 데이터로 자연어 인사이트 제공
  • Cognitive Lenses
  • Analytical Lens: Gemini 1.5 Pro로 실시간 Python 코드 생성 및 Plotly 그래프 생성
  • Imaginative Lens: 창의적 글쓰기 및 시 생성

3. 기술적 구현

  • 프레임워크
  • Streamlit을 기반으로 사용자 인터페이스 구축
  • Python, Pandas, Plotly로 에이전트 핵심 로직 구현
  • AI 모델
  • Gemini 1.5 Pro (분석 모드), Gemini 1.5 Flash (일반 모드)
  • 배포
  • DockerGoogle Cloud Run으로 클라우드 배포

4. 미래 계획

  • Mind Map 시각화 도구 추가 (사고 흐름 시각화)
  • Multimodal Conductor로 발전: Google BigQuery 연동, 웹 검색 툴 통합, 멀티모달 모델 활용

결론

  • 자율적 에이전트 프레임워크 구축 시 Gemini 1.5 Pro/FlashStreamlit의 조합이 효과적
  • Cognitive Lenses를 통해 AI의 다양한 사고 방식을 구현하는 것이 핵심
  • 커스텀 프레임워크는 AI 모델 연동과 확장성을 높이는 데 유리
  • SageMind Architecture는 미래 AI 시스템의 기초로 활용 가능