딥엑스 초저전력 AI칩, 엔비디아 GPU 대체 가능성
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

"GPU 대체 가능성 보인다"…딥엑스, '초저전력' AI칩으로 엔비디아에 도전장

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능, 머신러닝

대상자

AI 하드웨어 개발자, 산업용 AI 엔지니어, 클라우드/엣지 컴퓨팅 전문가

핵심 요약

  • 딥엑스 NPU는 엔비디아 GPU 대비 60분의 1 전력 소비로 동급 이상 추론 성능 제공
  • "와트 당 탑스" 대신 실효 처리량(프레임 처리 수) 기준으로 성능 평가 필요
  • 온디바이스 AI 요구사항: 자율화, 프라이버시 보호, 탄소 배출 감축 등 7가지 핵심 이슈 제시

섹션별 세부 요약

1. 딥엑스의 AI 반도체 전략 및 GPU 시장 견제

  • 김정욱 부사장, 클라우드 추론의 한계를 지적하며 "GPU의 시대가 끝났다"는 주장을 강조
  • GPU는 200TOPS를 위해 40와트를 소비하는 반면, 딥엑스 NPU는 25TOPS를 4.5와트로 구현
  • "연산량이 아니라 실제 프레임 처리 수가 핵심"이라는 성능 평가 기준 전환 제안

2. 딥엑스 NPU의 기술적 우위점

  • 35도 수준의 발열로 팬리스 환경에서도 안정 작동 가능
  • 산업용 AI, 스마트시티, 군사 분야 등 다양한 산업 적용 가능성 강조
  • LG유플러스와 협업한 '스몰 LLM' 구동 사례: 단말에서 기본 질의 처리, 복잡 연산은 클라우드로 전송

3. 온디바이스 AI의 7가지 핵심 필요성

  • 자율화, 무인화, 개인화, 연결 불안정 대응, 프라이버시 보호, 클라우드 비용 비효율, 탄소 배출 감축
  • 기술적 필요성과 인프라/환경 이슈를 아우르는 종합적 접근 제시

4. NPU 상용화 및 활용 사례

  • 자율주행차, CCTV, 로봇 등에 실장된 데모 영상 공개
  • 다양한 AI칩 라인업 확보, 산업 및 군사 분야에 즉시 적용 가능

5. 딥엑스의 차별화 전략

  • NPU의 성능 대비 발열 관리 기술: 사람 체온 수준(35도) 유지
  • 엣지 컴퓨팅 중심의 효율적 처리 구조로 속도·비용·보안 측면에서 우수

결론

  • GPU 중심의 AI 시장 구도를 NPU 기반 '초저전력' 솔루션으로 전환해야 한다
  • 성능 평가 기준을 '와트 당 탑스'에서 '실효 처리량(프레임 처리 수)'으로 전환 필요
  • 엣지 디바이스에 적용 가능한 NPU는 산업용 AI, 스마트시티 등 다양한 분야에서 실용적 가치 있음