ADK와 Gemini를 활용한 바베이도스 의회 데이터 분석 및 시민 참여 강화 프로젝트: 'Yuh Hear Dem'

🤖 AI 추천

AI 개발자, 백엔드 개발자, 데이터 엔지니어, 법률 기술(LegalTech) 분야에 관심 있는 개발자, 정부 및 공공 서비스 혁신에 기여하고자 하는 개발자에게 유용합니다.

🔖 주요 키워드

ADK와 Gemini를 활용한 바베이도스 의회 데이터 분석 및 시민 참여 강화 프로젝트: 'Yuh Hear Dem'

핵심 기술

본 프로젝트는 Google Agent Development Kit (ADK)와 Gemini 모델, 그리고 Knowledge Graph를 결합하여 바베이도스 의회 데이터를 시민들이 쉽게 접근하고 질문할 수 있도록 변환하는 혁신적인 솔루션을 제시합니다.

기술적 세부사항

  • 데이터 소스: 수백 개의 의회 세션 YouTube 영상 (1,200시간 이상)의 전체 자막 데이터를 활용합니다.
  • 데이터 처리 파이프라인:
    • Ingest: YouTube 자막 데이터를 수집합니다.
    • Clean: Gemini를 사용하여 문법 오류 수정, 화자 식별, 타임스탬프 정렬 등 자막 데이터를 정제 및 구조화합니다.
    • Extract: Gemini를 통해 개체 및 관계 추출(사람, 주제, 법안 등)을 수행하고, 이 정보를 MongoDB Atlas에 저장하여 33,000개 이상의 노드와 86,000개 이상의 관계를 가진 Knowledge Graph를 구축합니다.
  • 하이브리드 검색 (Hybrid Retrieval):
    • Vector Search: MongoDB Atlas의 임베딩을 활용하여 의미론적으로 유사한 자막 세그먼트를 검색합니다.
    • Knowledge Graph Search: Knowledge Graph의 개체와 관계를 탐색하여 특정 연결(예: 장관 -> 주제 -> 세션)을 찾습니다.
    • GraphRAG: 두 검색 결과를 결합하고 순위를 매겨 정확하고 출처가 명확한 답변을 생성합니다.
  • ADK 아키텍처 진화:
    • 초기 다중 에이전트 설계: ConversationalAgent 내에 ResearchPipeline (Researcher, Provenance, Writer 에이전트)을 사용하는 순차적 에이전트 구조를 시도했으나, ctx.session.state 공유 문제로 인해 안정성 확보에 어려움을 겪었습니다.
    • 단일 에이전트 솔루션으로 전환: 문제 해결을 위해 함수 도구를 사용하는 단일 지능형 에이전트로 아키텍처를 재구성했습니다. 이는 상태 관리를 용이하게 하고 디버깅을 간소화하여 안정적인 시스템 구축을 가능하게 했습니다.
  • 프론트엔드 및 UX: 교육 디자인 원칙을 적용하여 정보의 점진적 공개(Progressive Disclosure), 대화형 지식 그래프 시각화(D3.js 사용), 맥락에 맞는 후속 질문 제안 등을 통해 시민 접근성을 높였습니다.

개발 임팩트

  • 정부 투명성 증진 및 시민 참여 활성화에 기여합니다.
  • 대규모 비정형 데이터를 구조화하여 자연어 질의를 통한 정보 접근성을 획기적으로 개선합니다.
  • RAG와 Knowledge Graph의 효과적인 결합을 통해 높은 검색 정확도를 달성합니다.
  • ADK의 단일 에이전트 및 함수 도구 모델을 활용한 안정적인 AI 시스템 구축 사례를 보여줍니다.

커뮤니티 반응

(주어진 내용에 직접적인 커뮤니티 반응 언급은 없습니다.)

📚 관련 자료