텐센트 헌위안, 최초의 전문가 혼합(MoE) 모델 'A13B' 오픈소스로 공개 (EU, UK, 한국 제외)

📅 2025-06-28T06:32:48+09:00 👤 fanotify 🏷️ 개발

완성도:

0.8

🤖 AI 추천

AI 모델 개발 및 연구에 관심 있는 머신러닝 엔지니어, AI 연구원, 데이터 과학자에게 유용합니다. 특히 대규모 언어 모델(LLM)의 효율적인 아키텍처와 MoE 기술 동향을 파악하고자 하는 개발자에게 추천합니다.

💻 Development

텐센트가 개발한 대규모 모델군 '헌위안(Hunyuan)'의 전문가 혼합(Mixture-of-Experts, MoE) 모델인 '헌위안-A13B'가 오픈소스로 공개되었습니다. 이는 LLM의 효율성과 성능 향상을 위한 MoE 아키텍처의 실질적인 적용 사례를 제시합니다.

모델 아키텍처: 전문가 혼합(Mixture-of-Experts, MoE) 아키텍처를 채택하여, 특정 입력에 대해 활성화되는 소수의 전문가(expert)를 통해 계산 효율성을 높였습니다.
모델 크기: A13B는 130억 개의 파라미터를 가진 모델입니다.
오픈소스 공개: 프로젝트 코드 및 관련 자료가 오픈소스로 공개되었습니다.
지역 제한: 유럽 연합(EU), 영국(UK), 대한민국(한국)에서의 사용, 복제, 수정, 배포, 표시 등이 라이선스에 따라 금지되어 있습니다.

(제공된 텍스트에는 커뮤니티 반응에 대한 정보가 포함되어 있지 않습니다.)

본 내용은 텐센트의 최신 AI 모델 공개에 대한 기술적인 정보를 전달하며, IT 개발 기술 및 프로그래밍 커뮤니티를 대상으로 전문적이고 정보 제공적인 톤을 유지합니다. 지역 제한 사항에 대한 명확한 안내가 포함되어 있습니다.