개발 인공지능, 머신러닝, 데이터 분석

A

aitimes

2025. 05. 21

Google Enhances Gemini App with Real-Time Video & Deep Resea

구글, 실시간 비디오·딥 리서치 등으로 '제미나이' 앱 대폭 강화

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능, 머신러닝, 데이터 분석

대상자

*소프트웨어 개발자, AI 엔지니어, 기술 기획자**
난이도: 중간 수준 이상의 기술 이해가 필요
주로 AI 모델 및 통합 기술에 관심 있는 분야에서 실무 적용 가능

핵심 요약

제미나이 라이브(Gemini Live) 기능을 통해 실시간 영상/화면 인식과 AI 대화가 가능해져 멀티모달 인터페이스로의 진화를 이끌음
딥 리서치(Deep Research) 기능은 개인 문서 및 이미지 분석을 통해 맞춤형 리서치 결과 제공
경량 AI 모델 '젬마 3n'이 저사양 기기에서도 원활한 실행이 가능하며, Gemini Nano와 동일한 아키텍처를 공유

섹션별 세부 요약

1. 제미나이 라이브 기능

프로젝트 아스트라(Project Astra) 기반으로 구현된 실시간 영상/화면 인식 기능
사용자가 휴대폰 카메라 및 화면 콘텐츠를 AI와 실시간으로 공유 가능
구글 지도, 캘린더, 태스크 등 주요 앱과 연동 예정

2. 딥 리서치 기능 강화

사용자가 개인 PDF/이미지를 업로드하면 AI가 공개 데이터와 교차 분석
구글 드라이브와 지메일 연동 예정으로 개인화된 리서치 결과 제공
AI가 문서 및 이미지의 의미를 이해해 맞춤형 분석 가능

3. 제미나이 앱 기능 확장

이마젠 4(Imagen 4) 및 비오 3(Veo 3) 모델 탑재로 이미지/영상 생성 기능 강화
4억명 이상의 활성 사용자 보유하며, 5억명 확대 목표 설정

4. 경량 AI 모델 '젬마 3n' 발표

램 2GB 이하 기기에서도 실행 가능
Gemini Nano와 동일한 아키텍처 공유로 높은 성능 발휘
다양한 멀티모달 입력(오디오, 텍스트, 이미지, 영상) 처리 가능

결론

제미나이 라이브 및 딥 리서치 기능은 AI와의 실시간 상호작용을 가능하게 하며, 데이터 기반 맞춤형 분석을 제공
경량 AI 모델 '젬마 3n'은 저사양 기기에서도 높은 성능을 기대 가능
구글의 AI 사용 확대 전략은 5억명 사용자 확보 목표로 AI 기반 앱 생태계 확장에 기여 예상

구글 제미나이 AI 딥 리서치 Gemini Live Gemma 3n 멀티모달

목록으로 원문 보기