"GPU 대체 가능성 보인다"…딥엑스, '초저전력' AI칩으로 엔비디아에 도전장
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능, 머신러닝
대상자
AI 하드웨어 개발자, 산업용 AI 엔지니어, 클라우드/엣지 컴퓨팅 전문가
핵심 요약
- 딥엑스 NPU는 엔비디아 GPU 대비 60분의 1 전력 소비로 동급 이상 추론 성능 제공
- "와트 당 탑스" 대신 실효 처리량(프레임 처리 수) 기준으로 성능 평가 필요
- 온디바이스 AI 요구사항: 자율화, 프라이버시 보호, 탄소 배출 감축 등 7가지 핵심 이슈 제시
섹션별 세부 요약
1. 딥엑스의 AI 반도체 전략 및 GPU 시장 견제
- 김정욱 부사장, 클라우드 추론의 한계를 지적하며 "GPU의 시대가 끝났다"는 주장을 강조
- GPU는 200TOPS를 위해 40와트를 소비하는 반면, 딥엑스 NPU는 25TOPS를 4.5와트로 구현
- "연산량이 아니라 실제 프레임 처리 수가 핵심"이라는 성능 평가 기준 전환 제안
2. 딥엑스 NPU의 기술적 우위점
- 35도 수준의 발열로 팬리스 환경에서도 안정 작동 가능
- 산업용 AI, 스마트시티, 군사 분야 등 다양한 산업 적용 가능성 강조
- LG유플러스와 협업한 '스몰 LLM' 구동 사례: 단말에서 기본 질의 처리, 복잡 연산은 클라우드로 전송
3. 온디바이스 AI의 7가지 핵심 필요성
- 자율화, 무인화, 개인화, 연결 불안정 대응, 프라이버시 보호, 클라우드 비용 비효율, 탄소 배출 감축
- 기술적 필요성과 인프라/환경 이슈를 아우르는 종합적 접근 제시
4. NPU 상용화 및 활용 사례
- 자율주행차, CCTV, 로봇 등에 실장된 데모 영상 공개
- 다양한 AI칩 라인업 확보, 산업 및 군사 분야에 즉시 적용 가능
5. 딥엑스의 차별화 전략
- NPU의 성능 대비 발열 관리 기술: 사람 체온 수준(35도) 유지
- 엣지 컴퓨팅 중심의 효율적 처리 구조로 속도·비용·보안 측면에서 우수
결론
- GPU 중심의 AI 시장 구도를 NPU 기반 '초저전력' 솔루션으로 전환해야 한다
- 성능 평가 기준을 '와트 당 탑스'에서 '실효 처리량(프레임 처리 수)'으로 전환 필요
- 엣지 디바이스에 적용 가능한 NPU는 산업용 AI, 스마트시티 등 다양한 분야에서 실용적 가치 있음