Google Enhances Gemini App with Real-Time Video & Deep Resea

구글, 실시간 비디오·딥 리서치 등으로 '제미나이' 앱 대폭 강화

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능, 머신러닝, 데이터 분석

대상자

  • *소프트웨어 개발자, AI 엔지니어, 기술 기획자**
  • 난이도: 중간 수준 이상의 기술 이해가 필요
  • 주로 AI 모델 및 통합 기술에 관심 있는 분야에서 실무 적용 가능

핵심 요약

  • 제미나이 라이브(Gemini Live) 기능을 통해 실시간 영상/화면 인식AI 대화가 가능해져 멀티모달 인터페이스로의 진화를 이끌음
  • 딥 리서치(Deep Research) 기능은 개인 문서 및 이미지 분석을 통해 맞춤형 리서치 결과 제공
  • 경량 AI 모델 '젬마 3n'저사양 기기에서도 원활한 실행이 가능하며, Gemini Nano와 동일한 아키텍처를 공유

섹션별 세부 요약

1. 제미나이 라이브 기능

  • 프로젝트 아스트라(Project Astra) 기반으로 구현된 실시간 영상/화면 인식 기능
  • 사용자가 휴대폰 카메라 및 화면 콘텐츠를 AI와 실시간으로 공유 가능
  • 구글 지도, 캘린더, 태스크 등 주요 앱과 연동 예정

2. 딥 리서치 기능 강화

  • 사용자가 개인 PDF/이미지를 업로드하면 AI가 공개 데이터와 교차 분석
  • 구글 드라이브와 지메일 연동 예정으로 개인화된 리서치 결과 제공
  • AI가 문서 및 이미지의 의미를 이해해 맞춤형 분석 가능

3. 제미나이 앱 기능 확장

  • 이마젠 4(Imagen 4)비오 3(Veo 3) 모델 탑재로 이미지/영상 생성 기능 강화
  • 4억명 이상의 활성 사용자 보유하며, 5억명 확대 목표 설정

4. 경량 AI 모델 '젬마 3n' 발표

  • 램 2GB 이하 기기에서도 실행 가능
  • Gemini Nano와 동일한 아키텍처 공유로 높은 성능 발휘
  • 다양한 멀티모달 입력(오디오, 텍스트, 이미지, 영상) 처리 가능

결론

  • 제미나이 라이브 및 딥 리서치 기능AI와의 실시간 상호작용을 가능하게 하며, 데이터 기반 맞춤형 분석을 제공
  • 경량 AI 모델 '젬마 3n'저사양 기기에서도 높은 성능을 기대 가능
  • 구글의 AI 사용 확대 전략5억명 사용자 확보 목표로 AI 기반 앱 생태계 확장에 기여 예상