스노플레이크의 새로운 기능: Cortex AISQL로 다중 모달 데이터 분석

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

데이터 분석

대상자

데이터 분석가, SQL 개발자, AI 엔지니어

- 난이도: 중간 (SQL 기초 지식과 AI 기능 이해 필요)

- 주요 활용 분야: 텍스트 및 이미지 기반 데이터 분석, 고객 문제 해결 자동화

핵심 요약

  • AI 기능 통합: Cortex AISQL은 SQL 엔진에 AI 기능을 직접 통합하여 AI_COMPLETE, AI_FILTER, AI_AGG 등의 API로 텍스트/이미지 분석 가능
  • 성능 및 비용 효율성: 기존 AI 구현 대비 30% 이상의 속도 향상60% 비용 절감
  • 다양한 데이터 지원: 새로운 FILE 데이터 타입을 통해 구조화된 데이터비구조화된 데이터(이미지, 텍스트)를 연결 분석 가능

섹션별 세부 요약

1. 기능 개요

  • Cortex AISQLLLM Functions 기능을 포함하여 AI 기반 SQL 분석을 제공
  • FILE 타입을 통해 이미지, 텍스트 등 다중 모달 데이터를 SQL로 처리 가능
  • 비용 구조: 100만 토큰당 크레딧 소비 기준으로 명시

2. 설정 및 사용 방법

  • 설치 단계:

- setup.sql 실행으로 환경 구성

- 이미지 파일@DASH_DB.DASH_SCHEMA.DASH_IMAGE_FILES 스테이지에 업로드

- images.sql 실행으로 IMG_FILE 컬럼을 포함한 테이블 생성

  • Notebook 생성: cortex_aisql.ipynb 파일 업로드 후 라이브러리 로드

3. 주요 쿼리 예시

  • AI_COMPLETE 사용:

- 이미지 분석: AI_COMPLETE('pixtral-large', prompt('Summarize this issue shown in this screenshot in one concise sentence: {0}', img_file))

- 이메일 분석: AI_COMPLETE('claude-3-7-sonnet', prompt('Summarize this issue in one concise sentence...', content))

  • AI_FILTER 사용:

- 문제-해결 매핑: AI_FILTER(prompt('Check if the solution article can address customer concerns...', content, s.solution))

  • AI_AGG 사용:

- 월별 이슈 집계: AI_AGG(summary, 'Analyze all the support ticket reviews...')

4. 제한 사항 및 팁

  • JOIN 연산 제한: AI_FILTER 기반 JOIN 시 500개 이하의 행만 처리 가능

- 대규모 JOINAccount Manager에게 Adaptive Optimization Preview 요청 필요

  • 결과 불일치: AI_AGG 결과가 랜덤 샘플링에 따라 미세하게 달라질 수 있음

결론

  • Cortex AISQL은 SQL 기반의 AI 분석을 통해 다중 모달 데이터(텍스트, 이미지)를 효율적으로 처리 가능

- 실무 적용 시:

- AI_AGG이슈 집계Streamlit으로 시각화

- JOIN 제한을 고려한 데이터 샘플링Adaptive Optimization 활성화 권장