Databricks Data + AI Summit 2025 주요 발표: Lakeflow, Unity Catalog 확장, Spark Declarative Pipelines 등
🤖 AI 추천
Databricks 플랫폼 사용자, 데이터 엔지니어, 데이터 과학자, AI 엔지니어 및 데이터 아키텍트에게 유용하며, 특히 데이터 파이프라인 구축, 데이터 거버넌스 강화, AI 모델 개발 및 배포에 관심 있는 모든 수준의 개발자에게 권장됩니다.
🔖 주요 키워드
핵심 기술: Databricks Data + AI Summit 2025에서는 데이터 수집, 변환, 오케스트레이션부터 AI 모델 관리 및 거버넌스까지 아우르는 포괄적인 솔루션들을 발표하여 데이터 및 AI 생태계를 혁신할 새로운 기능들을 공개했습니다.
기술적 세부사항:
* Databricks Lakeflow: 엔터프라이즈 애플리케이션, 데이터베이스, 데이터 웨어하우스 통합을 위한 관리형 커넥터를 포함한 데이터 수집, 변환 및 오케스트레이션을 위한 통합 솔루션.
* Zerobus: 고처리량, 저지연 실시간 이벤트 데이터 수집을 위한 API.
* Unity Catalog 업데이트: 다양한 형식, 클라우드, 팀 간 데이터 및 AI 거버넌스 통합.
* Attribute-Based Access Control (ABAC): 태그를 사용한 유연한 액세스 정책 제어 (AWS, Azure, GCP 베타).
* Tag Policies: 플랫폼 전반의 데이터 분류 및 사용에 대한 일관성 및 보안 강화 (주요 클라우드 베타).
* 데이터 공유 개선: 개인 정보 보호 및 보안을 침해하지 않고 협업할 수 있는 "clean rooms" 기능.
* Apache Iceberg™ 완전 지원: 오픈 포맷 데이터 관리 확장 및 다양한 도구와의 통합 용이성 증대.
* Spark Declarative Pipelines: 선언적이고 확장 가능하며 개방적인 방식으로 데이터 파이프라인 개발을 지원하는 진화된 기능.
* Databricks SQL 일반 사용 가능 및 무료 에디션 출시: 모든 규모의 조직을 위한 고급 데이터 분석 및 인텔리전스 리소스 접근성 민주화.
* MLflow 3.0: 머신러닝 프로젝트 라이프사이클 전반의 실험, 관찰 가능성 및 AI 모델 거버넌스 개선.
* Mosaic AI 신규 기능: 자체 최적화 에이전트 생성을 위한 Agent Bricks 등 지능형 에이전트 개발 기능 강화.
* Lakebase 개념 공개 프리뷰: 트랜잭션 및 분석 데이터를 단일 환경에서 관리하는 혁신적인 접근 방식.
* Azure Databricks 커넥터 for Power Platform: Power Apps, Power Automate, Copilot Studio에 대한 실시간 거버넌스 데이터 액세스 제공.
개발 임팩트: 이번 발표들은 데이터 엔지니어링 생산성 향상, AI 모델 개발 및 배포 간소화, 데이터 거버넌스 강화, 그리고 다양한 클라우드 및 도구와의 연동성 확대를 통해 조직 내 데이터 활용 및 AI 도입 가속화를 지원합니다. 특히 Zerobus와 Spark Declarative Pipelines는 데이터 파이프라인의 효율성과 유연성을 크게 향상시킬 것으로 기대됩니다.
커뮤니티 반응: (원문에 직접적인 커뮤니티 반응 언급 없음)