스노플레이크의 새로운 기능: Cortex AISQL로 다중 모달 데이터 분석
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
데이터 분석
대상자
데이터 분석가, SQL 개발자, AI 엔지니어
- 난이도: 중간 (SQL 기초 지식과 AI 기능 이해 필요)
- 주요 활용 분야: 텍스트 및 이미지 기반 데이터 분석, 고객 문제 해결 자동화
핵심 요약
- AI 기능 통합: Cortex AISQL은 SQL 엔진에 AI 기능을 직접 통합하여
AI_COMPLETE
,AI_FILTER
,AI_AGG
등의 API로 텍스트/이미지 분석 가능 - 성능 및 비용 효율성: 기존 AI 구현 대비 30% 이상의 속도 향상 및 60% 비용 절감
- 다양한 데이터 지원: 새로운
FILE
데이터 타입을 통해 구조화된 데이터와 비구조화된 데이터(이미지, 텍스트)를 연결 분석 가능
섹션별 세부 요약
1. 기능 개요
- Cortex AISQL은 LLM Functions 기능을 포함하여 AI 기반 SQL 분석을 제공
FILE
타입을 통해 이미지, 텍스트 등 다중 모달 데이터를 SQL로 처리 가능- 비용 구조: 100만 토큰당 크레딧 소비 기준으로 명시
2. 설정 및 사용 방법
- 설치 단계:
- setup.sql
실행으로 환경 구성
- 이미지 파일을 @DASH_DB.DASH_SCHEMA.DASH_IMAGE_FILES
스테이지에 업로드
- images.sql
실행으로 IMG_FILE
컬럼을 포함한 테이블 생성
- Notebook 생성:
cortex_aisql.ipynb
파일 업로드 후 라이브러리 로드
3. 주요 쿼리 예시
AI_COMPLETE
사용:
- 이미지 분석: AI_COMPLETE('pixtral-large', prompt('Summarize this issue shown in this screenshot in one concise sentence: {0}', img_file))
- 이메일 분석: AI_COMPLETE('claude-3-7-sonnet', prompt('Summarize this issue in one concise sentence...', content))
AI_FILTER
사용:
- 문제-해결 매핑: AI_FILTER(prompt('Check if the solution article can address customer concerns...', content, s.solution))
AI_AGG
사용:
- 월별 이슈 집계: AI_AGG(summary, 'Analyze all the support ticket reviews...')
4. 제한 사항 및 팁
- JOIN 연산 제한:
AI_FILTER
기반 JOIN 시 500개 이하의 행만 처리 가능
- 대규모 JOIN은 Account Manager에게 Adaptive Optimization Preview 요청 필요
- 결과 불일치:
AI_AGG
결과가 랜덤 샘플링에 따라 미세하게 달라질 수 있음
결론
- Cortex AISQL은 SQL 기반의 AI 분석을 통해 다중 모달 데이터(텍스트, 이미지)를 효율적으로 처리 가능
- 실무 적용 시:
- AI_AGG
로 이슈 집계 및 Streamlit으로 시각화
- JOIN 제한을 고려한 데이터 샘플링 및 Adaptive Optimization 활성화 권장