Install Fanar-1 9B Arabic-English LLM Locally: Step-by-Step
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

How to Install Fanar-1 9B Arabic-English LLM Locally?

카테고리

프로그래밍/소프트웨어 개발

서브카테고리

인공지능

대상자

- AI 모델 개발자: 다국어 대화 시스템 및 교육 도구 개발에 관심 있는 개발자

- 문화 기술 연구자: 중동 지역의 문화적 맥락을 반영한 NLP 모델 활용을 원하는 연구자

- 교육 기관: 이슬람 가치와 현대 언어 처리 기술을 결합한 교육 콘텐츠 개발자

- 난이도: 중간 (GPU 환경 설정, Python 버전 관리, 모델 배포 등 기술적 지식 필요)

핵심 요약

  • Fanar-1-9B-InstructQCRI에서 개발한 아랍어-영어 이중 언어 모델로, Gemma-2-9B 기반으로 1T 토큰의 데이터로 학습됨
  • GPU VM 설정을 통해 배포: NodeShiftNVIDIA CUDA VM 활용, Python 3.11 설치 및 LitGPT 프레임워크 사용
  • 문화적 맥락이슬람 가치 반영: Gulf/Levantine/Egyptian 방언Modern Standard Arabic (MSA)에 특화

섹션별 세부 요약

1. 모델 개요 및 특징

  • QCRI에서 개발, Gemma-2-9B 기반으로 1T 토큰의 데이터로 학습
  • 4.5M 명령250K DPO 페어이슬람 가치문화적 이해 강화
  • 아랍어-영어 이중 언어 모델로, 정부/교육/시민 기술 분야에 적합

2. 데이터셋 구성

  • 515B English 토큰: Dolma 데이터셋에서 선별
  • 410B Arabic 토큰: 다양한 출처에서 수집 및 필터링
  • 102B 코드 토큰: The Stack 데이터셋에서 추출
  • LitGPT 프레임워크 사용

3. GPU VM 설정 절차

  • NodeShift 플랫폼에서 GPU Node 생성: RTXA6000 GPU 권장
  • SSH 키 인증 설정: 보안 강화
  • NVIDIA CUDA VM 이미지 선택: Fanar-1 9B 설치 지원

4. Python 환경 구성

  • Python 3.11 설치: deadsnakes PPA 활용
  • pip 업데이트: get-pip.py 스크립트 실행
  • Python 3.11기본 버전으로 설정: sudo update-alternatives 명령 사용

5. 모델 설치 및 실행

  • text-generation-webui 레포 클론: git clone 명령 실행
  • start_linux.sh 스크립트 실행: CUDA/NVIDIA GPU 백엔드 선택
  • QCRI/Fanar-1-9B-Instruct 모델 다운로드 및 로드: python3 download-model.py 명령 사용

6. 사용 예시

  • 아랍어-영어 번역: "The weather is beautiful in Doha today." → "الطقس جميل في الدوحة اليوم."
  • 문화적 분석: 현대 소설과 사라의 시대의 문학 표현 비교
  • 호스피탈리티의 중요성 설명 및 아랍어 번역

결론

  • NodeShift 플랫폼에서 GPU VM 설정 후 10분 이내Fanar-1 9B 모델 배포 가능
  • Python 3.11, CUDA, LitGPT 기반으로 문화적 맥락이슬람 가치 반영
  • 아랍어-영어 이중 언어 처리교육/정부 애플리케이션에 적합한 AI 모델 선택
  • SSH 터널링을 통해 로컬에서 웹 UI 접근 가능: ssh -L 7860:127.0.0.1:7860 명령 사용