NPU를 활용한 엣지 디바이스에서의 실시간 얼굴 인식 시스템 구축: 3DiVi의 경험

🤖 AI 추천

임베디드 시스템 개발자, 머신러닝 엔지니어, 컴퓨터 비전 엔지니어, IoT 솔루션 개발자 등 엣지 컴퓨팅 환경에서 AI 모델의 성능 최적화에 관심 있는 개발자에게 유용합니다.

🔖 주요 키워드

NPU를 활용한 엣지 디바이스에서의 실시간 얼굴 인식 시스템 구축: 3DiVi의 경험

핵심 기술: 엣지 디바이스에서 실시간 얼굴 인식 시스템 구현 시, 제한된 컴퓨팅 자원 내에서 CNN 모델의 추론 속도를 최적화하기 위해 NPU(신경망 처리 장치)를 활용하는 방법론을 제시합니다.

기술적 세부사항:
* 얼굴 인식 파이프라인: Face Detection (CNN 기반), Key Point Detection (CNN 기반 "Face Fitter"), Face Alignment, Template Extraction (CNN 기반)으로 구성됩니다.
* 성능 병목: 신경망 추론 시간, 특히 Face Detector, Face Fitter, Template Extractor 모델의 추론 시간이 주요 성능 제약 요소입니다.
* 목표 시간 제약: Face Detector와 Face Fitter의 결합 시간 ≤40ms, Template 추출 및 비교 시간 ≤500ms.
* 하드웨어 제약: Rockchip OK3568과 같은 저사양 싱글 보드 컴퓨터를 사용했습니다.
* NPU 추론 모드: Rockchip NPU는 Float32를 Float16으로 변환하는 Default Mode와 Float32를 Int8로 변환하는 Quantized Mode를 지원합니다.
* Quantization 효과: Int8 양자화는 추론 속도를 크게 향상시키지만, 정확도 하락이 발생할 수 있습니다. 파인튜닝을 통해 실제 운영 가능한 수준의 정확도를 확보했습니다.

개발 임팩트:
* NPU를 통해 무거운 AI 모델을 엣지 디바이스에 효율적으로 탑재하고 실시간 처리가 가능해졌습니다.
* 엄격한 시간 제약 조건 하에서 얼굴 인식 시스템의 성능을 성공적으로 만족시켰습니다.
* CV/ML 모델을 NPU로 포팅하는 것이 추론 가속화에 효과적인 방법임을 입증했습니다.

커뮤니티 반응:
* (언급 없음)

📚 관련 자료