"Yuh Hear Dem": 민주주의 투명성 강화를 위한 AI 시스템 구축
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능, 데이터 분석, DevOps
대상자
- 개발자, 데이터 과학자, AI/ML 엔지니어, 시민 기술(Civic Tech) 개발자
- 난이도: 중급~고급 (실무적인 AI 구현 및 아키텍처 결정 사례 중심)
핵심 요약
- Hybrid RAG 파이프라인 사용: Gemini 및 MongoDB Atlas 기반의 구조화된 의회 데이터 검색
- 모듈리티 향상을 위한 아키텍처 전환: multi-agent → single-agent 모델로 session state management 문제 해결
- 사용자 중심 디자인 적용: D3.js 기반 지식 그래프, progressive disclosure 방식의 UI
섹션별 세부 요약
1. Ingest, Clean, Extract
- 데이터 수집: 1,200시간 이상의 의회 YouTube 영상 전사본 수집
- Gemini 활용: 문법 정리, 발언자 식별, timestamp 매핑
- 지식 그래프 구축: MongoDB Atlas에 저장된 33,000 노드, 86,000 명명된 관계 포함
2. Hybrid Retrieval with GraphRAG
- 벡터 검색: MongoDB Atlas 임베딩을 기반으로 세마틱 검색 수행 (주제 기반 질문 대응)
- 지식 그래프 검색:
Minister -> Topic -> Session
과 같은 구조적 관계 탐색 (사실 기반 질문 대응) - GraphRAG 모델: 검색 결과의 하이브리드 점수 계산 및 비디오 timestamp 기반 링크 생성
3. Agent Architecture Evolution
- 최초 설계:
SequentialAgent
기반 multi-agent 파이프라인 (ResearcherAgent, ProvenanceAgent, WriterAgent) - 장애점:
ctx.session.state
의 불안정한 공유로 인한 데이터 손실 및 디버깅 어려움 - 전환: single-agent 모델로 재구성 (LlmAgent, FunctionTool 사용)
- FunctionTool 예시: search_parliament_hybrid
, clear_session_graph
- 장점: 모듈리티 유지 및 실시간 상태 관리