ADK와 Gemini를 활용한 바베이도스 의회 데이터 분석 및 시민 참여 강화 프로젝트: 'Yuh Hear Dem'
🤖 AI 추천
AI 개발자, 백엔드 개발자, 데이터 엔지니어, 법률 기술(LegalTech) 분야에 관심 있는 개발자, 정부 및 공공 서비스 혁신에 기여하고자 하는 개발자에게 유용합니다.
🔖 주요 키워드

핵심 기술
본 프로젝트는 Google Agent Development Kit (ADK)와 Gemini 모델, 그리고 Knowledge Graph를 결합하여 바베이도스 의회 데이터를 시민들이 쉽게 접근하고 질문할 수 있도록 변환하는 혁신적인 솔루션을 제시합니다.
기술적 세부사항
- 데이터 소스: 수백 개의 의회 세션 YouTube 영상 (1,200시간 이상)의 전체 자막 데이터를 활용합니다.
- 데이터 처리 파이프라인:
- Ingest: YouTube 자막 데이터를 수집합니다.
- Clean: Gemini를 사용하여 문법 오류 수정, 화자 식별, 타임스탬프 정렬 등 자막 데이터를 정제 및 구조화합니다.
- Extract: Gemini를 통해 개체 및 관계 추출(사람, 주제, 법안 등)을 수행하고, 이 정보를 MongoDB Atlas에 저장하여 33,000개 이상의 노드와 86,000개 이상의 관계를 가진 Knowledge Graph를 구축합니다.
- 하이브리드 검색 (Hybrid Retrieval):
- Vector Search: MongoDB Atlas의 임베딩을 활용하여 의미론적으로 유사한 자막 세그먼트를 검색합니다.
- Knowledge Graph Search: Knowledge Graph의 개체와 관계를 탐색하여 특정 연결(예: 장관 -> 주제 -> 세션)을 찾습니다.
- GraphRAG: 두 검색 결과를 결합하고 순위를 매겨 정확하고 출처가 명확한 답변을 생성합니다.
- ADK 아키텍처 진화:
- 초기 다중 에이전트 설계:
ConversationalAgent
내에ResearchPipeline
(Researcher, Provenance, Writer 에이전트)을 사용하는 순차적 에이전트 구조를 시도했으나,ctx.session.state
공유 문제로 인해 안정성 확보에 어려움을 겪었습니다. - 단일 에이전트 솔루션으로 전환: 문제 해결을 위해 함수 도구를 사용하는 단일 지능형 에이전트로 아키텍처를 재구성했습니다. 이는 상태 관리를 용이하게 하고 디버깅을 간소화하여 안정적인 시스템 구축을 가능하게 했습니다.
- 초기 다중 에이전트 설계:
- 프론트엔드 및 UX: 교육 디자인 원칙을 적용하여 정보의 점진적 공개(Progressive Disclosure), 대화형 지식 그래프 시각화(D3.js 사용), 맥락에 맞는 후속 질문 제안 등을 통해 시민 접근성을 높였습니다.
개발 임팩트
- 정부 투명성 증진 및 시민 참여 활성화에 기여합니다.
- 대규모 비정형 데이터를 구조화하여 자연어 질의를 통한 정보 접근성을 획기적으로 개선합니다.
- RAG와 Knowledge Graph의 효과적인 결합을 통해 높은 검색 정확도를 달성합니다.
- ADK의 단일 에이전트 및 함수 도구 모델을 활용한 안정적인 AI 시스템 구축 사례를 보여줍니다.
커뮤니티 반응
(주어진 내용에 직접적인 커뮤니티 반응 언급은 없습니다.)
📚 관련 자료
LangChain
The project heavily utilizes RAG and agent-based architectures, which are core components and functionalities of the LangChain framework. While ADK is specific, LangChain provides foundational tools for building similar LLM applications with complex pipelines and tool integrations.
관련도: 90%
LlamaIndex
LlamaIndex is excellent for data indexing and retrieval, especially for knowledge graph integration and RAG pipelines, which are central to the 'Yuh Hear Dem' project's ability to query structured parliamentary data effectively.
관련도: 85%
Neo4j
Although MongoDB Atlas was used for the knowledge graph, Neo4j is a leading graph database. The project's reliance on a knowledge graph for entity and relationship extraction and traversal makes Neo4j a highly relevant open-source alternative for implementing such data structures.
관련도: 70%