실험실과 [FAILED]의 전투
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
개발 툴
대상자
리눅스 시스템에서 대규모 AI 모델을 설치/실행하려는 개발자 및 시스템 관리자 (중간 난이도)
핵심 요약
codellama:70b
모델 설치로 인한 124GB SSD 공간 부족으로gdm.service
실패 발생- Docker 컨테이너 및 볼륨 제거(
docker stop
,docker rm
,docker volume rm
)로 40GB 이상 공간 회수 sudo apt full-upgrade
명령으로 시스템 패키지 재설치 및 복구 수행
섹션별 세부 요약
1. 실험실 실패 원인
codellama:70b
모델(39GB) 설치 시 SSD 공간 부족(124GB SSD 기준)gdm.service
실패로 인해 GNOME 인터페이스 복구 불가- 컨테이너 도커 내 모델이 디스크 캐시 공간 확보 실패
2. 복구 프로세스
- TTL+F2 키 조합으로 임시 터미널 접근
docker stop [ID]
명령으로 컨테이너 중지docker volume rm ollama
로 모델 볼륨 삭제sudo apt full-upgrade
로 시스템 패키지 재설치
3. 사후 관리
- 디스크 공간 확보 후
sudo reboot
명령으로 시스템 재부팅 - AI 모델 설치 전 디스크 용량 체크 필수
결론
- 대규모 AI 모델 설치 전 디스크 용량 확보 및 컨테이너/볼륨 관리가 필수적
docker volume rm
과apt full-upgrade
명령으로 시스템 복구 절차 정리- 리눅스 시스템 관리자에게 시스템 복구 전략 제공