MiniCPM4-8B 로컬 설치 및 실행 가이드

카테고리

프로그래밍/소프트웨어 개발

앱 개발

MiniCPM4-8B 모델 특징: 8B 파라미터, InfLLM v2 스파스 어텐션 기술 적용, 8트릴리온 토큰으로 훈련된 UltraClean 및 UltraChat v2 데이터셋 사용
시스템 요구사항: RTX 4090/A6000 GPU, 24GB VRAM, 20GB 저장공간, Anaconda 설치 필수
배포 방법: NodeShift GPU 클라우드 사용, SSH 연결 및 Jupyter Notebook 활용

- 1x RTX A6000, 64vCPU, 63GB RAM, 200GB SSD 구성

- SSH 키 인증 사용 권장 (보안 강화)

```bash

conda create -n minicpm python=3.11 -y && conda activate minicpm

```

```bash

pip install torch torchvision torchaudio einops timm pillow huggingface_hub

```

```bash

ssh -L 8888:localhost:8888 -p -i root@

```

```python

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("openbmb/MiniCPM4-8B", torch_dtype=torch.bfloat16, device_map="cuda")

tokenizer = AutoTokenizer.from_pretrained("openbmb/MiniCPM4-8B")

```

```python

responds, history = model.chat(tokenizer, "Write a savvy twitter post about", temperature=0.7, top_p=0.7)

```