알리바바, 아이폰용 '큐원3' 출시..중국 아이폰에 AI 탑재 예고
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
인공지능, 머신러닝
대상자
AI 개발자, 소프트웨어 엔지니어, 기술 기획자
핵심 요약
- 큐원3(Qwen3)는 애플 MLX 프레임워크에 최적화된 온디바이스 AI 모델로, 중국 내 데이터 보안 규제에 대응 가능
- MoE(Mixture of Experts) 아키텍처를 채택해 토큰당 5~10%의 매개변수만 사용하면서도 최대 2350억 매개변수까지 확장 가능
- 하이브리드 시스템을 통해 사고 지속 시간 최대 3만8000 토큰 설정 가능, AI 성능과 연산 효율성 균형 제공
섹션별 세부 요약
1. 큐원3 모델 출시 및 기능
- MLX 프레임워크에 최적화되어, 연산 자원 사용 90% 감소하면서도 강력한 AI 성능 유지
- 데이터를 해외 서버로 전송하지 않고 기기 내에서 직접 작동 가능, 중국 내 데이터 보안 규제에 적합
- 구글 제미나이, 메타 라마3 등 경쟁 모델 대비 비용 절감 30~40% 효과 제공
2. 오픈소스 통합 및 사용자 유연성
- MLX-LM은 허깅페이스와 완전히 통합, 4400개 이상의 LLM을 클라우드 의존 없이 로컬에서 실행 가능
- 추론 모드와 비추론 모드 간 전환이 가능한 하이브리드 시스템 도입
- 사용자가 최대 3만8000 토큰까지 ‘사고 지속 시간’ 설정 가능, 정교한 AI 작업에 적합
3. 아키텍처 변형 및 효율성
- 덴스(Dense) 모델: 모든 매개변수 항상 활성화, 예측 가능한 성능과 저지연 처리 가능
- MoE 모델: 입력에 따라 일부 전문가만 활성화, 토큰당 5~10% 매개변수 사용
- MoE 모델은 동일한 규모의 덴스 모델 대비 네트워크 통신량 50% 감소, 이기종 환경 추론에 유리
결론
- 큐원3은 애플 MLX와 MoE 아키텍처를 결합해 중국 내 AI 모델로의 진출을 가속화하며, 비용 효율성과 성능 균형을 제공하는 핵심 AI 솔루션이다.