개발 DevOps

D

dev_to

2025. 07. 04

the keywords were a mix of English and Korean terms, but the

AI 앱 배포를 간소화한 Cloud Run 연동 기능

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

DevOps

대상자

AI 개발자, 클라우드 엔지니어, DevOps 팀

- 난이도: 중간 (기본적인 클라우드 배포 지식 필요)

핵심 요약

Cloud Run과 AI Studio 연동으로 앱 배포 시간을 1초 이내로 단축 가능
Gemma 3 모델은 GPU 기반 인스턴스를 통해 5초 이내에 배포 가능
MCP 프로토콜 기반 앱은 Cloud Run MCP 서버를 통해 자동 배포 지원
Gemini API 키는 서버 측에서 암호화 관리하여 보안 강화

섹션별 세부 요약

1. AI Studio에서 Cloud Run으로의 간편 배포

단일 버튼 클릭으로 AI Studio에서 개발한 앱을 Cloud Run으로 배포 가능
배포 후 HTTPS 엔드포인트 자동 생성, 무료 티어 포함 (월 200만 요청 제공)
Gemini API 키는 클라우드 서버에서 관리되어 클라이언트 장치로 노출되지 않음
요청 기반 청구로 비용 효율성 확보 (100ms 단위 청구)

2. Gemma 3 모델의 직접 배포

Gemma 3 모델은 AI Studio에서 GPU 기반 인스턴스로 5초 이내 배포 가능
Cloud Run 인프라에서 GPU 인스턴스 자동 확장 및 사용량에 따른 청구
Gen AI SDK와 호환성 제공 (코드 내 두 개의 파라미터만 수정하여 사용 가능)

from google import genai
from google.genai.types import HttpOptions
client = genai.Client(api_key="KEY_RECEIVED_WHEN_DEPLOYING",
http_options=HttpOptions(base_url="CLOUD_RUN_ENDPOINT_URL"))

3. MCP 프로토콜 기반 앱 배포

Model Context Protocol (MCP) 표준을 기반으로 AI 에이전트와의 상호작용 지원
Cloud Run MCP 서버를 통해 AI 에이전트가 직접 앱 배포 가능
AI 어시스턴트 앱, AI 기반 IDE, 에이전트 SDK 등 다양한 클라이언트 지원
Gen AI SDK 및 에이전트 개발 키트에서도 MCP를 통해 Cloud Run 배포 지원

결론

AI Studio와 Cloud Run 연동은 개발-배포-확장 프로세스를 100% 자동화하여 실무 적용 시 시간 절약 가능
MCP 서버를 활용하면 다양한 에이전트 툴과의 호환성 확보 가능
Gemma 3 모델 배포 시 GPU 인스턴스 사용으로 성능과 비용 효율성 균형 도달
Gemini API 키의 서버 측 암호화 관리로 보안 리스크 최소화해야 함

Cloud Run AI Studio Gemma 3 AI deployment MCP Model Context Protocol Google AI Studio

목록으로 원문 보기