카카오페이, 생성형 AI 기반 대출 음성 상담 챗봇 개발기: AWS AI 서비스 활용 및 RAG 적용

🤖 AI 추천

카카오페이에서 진행된 해커톤 프로젝트를 통해 생성형 AI를 활용한 금융 서비스 개발 경험을 공유하는 글입니다. 음성 인식부터 챗봇 응답 생성, 음성 합성까지 전 과정에 AWS AI 서비스를 활용한 사례와 개인 맞춤형 추천을 위한 RAG(Retrieval-Augmented Generation) 방식 적용 등 실제 개발 과정에서의 인사이트를 얻고 싶은 백엔드 개발자, AI/ML 엔지니어, 핀테크 서비스 기획자에게 추천합니다.

🔖 주요 키워드

카카오페이, 생성형 AI 기반 대출 음성 상담 챗봇 개발기: AWS AI 서비스 활용 및 RAG 적용

핵심 기술

이 글은 생성형 AI와 AWS AI 서비스를 결합하여 대출 음성 상담 챗봇을 개발한 경험을 공유합니다. 비대면 금융 서비스의 개인화된 상담 부재 문제를 해결하기 위해 음성 인식(STT), 자연어 이해 및 응답 생성(LLM), 음성 합성(TTS)을 통합하는 과정을 상세히 다룹니다.

기술적 세부사항

  • 서비스 아키텍처: WebSocket 기반 실시간 통신을 활용하여 프론트엔드와 백엔드 간 음성 데이터를 스트리밍하고 처리합니다.
  • AWS AI 서비스 연동:
    • Amazon Transcribe: 사용자의 음성을 텍스트로 변환하는 STT 기능을 제공합니다.
    • Amazon Bedrock: Anthropic Claude 모델을 활용하여 사용자의 질문에 대한 금융 관련 답변을 생성합니다. 금융 도메인 특화 프롬프트 엔지니어링을 적용했습니다.
    • Amazon Polly: 생성된 텍스트 응답을 자연스러운 한국어 음성으로 변환하는 TTS 기능을 제공합니다.
  • 백엔드 구현:
    • 코틀린 코루틴 채널: 비동기 처리 흐름을 단순화하고 핸들러의 책임을 데이터 가공 및 전달로 한정하기 위해 사용했습니다.
    • 세션 ID 기반 채널 매핑: 다중 사용자 동시 접속 시 사용자 간 영향을 제거하기 위해 각 WebSocket 세션에 고유한 세션 ID를 부여하고 관련 채널을 관리했습니다.
  • AI Agent 파이프라인:
    • 합성 데이터 생성: 민감한 개인 정보를 보호하면서 AI 모델 학습 및 테스트를 위해 원본 데이터의 통계적 속성을 유지하는 합성 데이터를 생성했습니다. Hadoop에서 가명 처리된 데이터를 추출하고, 변수 분포 및 상관관계 정보를 분석하여 코풀라 함수를 활용했습니다.
    • RAG (Retrieval-Augmented Generation): 금융사의 대출 상품 정보 및 고객 관련 데이터 변화에 유연하게 대응하기 위해 최신 정보를 외부 지식 베이스로 관리하는 RAG 방식을 도입했습니다.
      • 청킹 (Chunking): 긴 텍스트 데이터를 분할하고 의미론적 맥락을 보존하기 위해 적용했습니다.
      • 벡터 스토어: 임베딩된 고객 및 대출 상품 정보를 저장하고 실시간 검색을 위해 OpenSearch Serverless를 활용했습니다.

개발 임팩트

이 프로젝트는 생성형 AI와 클라우드 AI 서비스를 금융 도메인에 성공적으로 접목하여 개인화된 비대면 상담 경험을 제공하는 가능성을 보여줍니다. 특히, 데이터 프라이버시 문제를 해결하기 위한 합성 데이터 생성 및 최신 정보를 반영하는 RAG 시스템 구축은 향후 금융 AI 서비스 개발에 유용한 방법론을 제시합니다. 또한, 코틀린 코루틴을 활용한 비동기 처리 설계는 시스템의 복잡성을 줄이고 개발 생산성을 높이는 데 기여했습니다.

커뮤니티 반응

(원문에 커뮤니티 반응에 대한 직접적인 언급은 없습니다.)

📚 관련 자료