지원 모델
AIRGAP Studio 가 지원하는 6종 AI 모델 카탈로그
개요
AIRGAP Studio 는 인스톨러에 Qwen3-8B-Q4_K_M.gguf (baseline) 을 기본 동봉합니다. 추가 모델은 모델팩 인스톨러를 별도로 설치하거나, build/vscodium/models/ 디렉토리에 .gguf 파일을 직접 배치하면 자동으로 탐지됩니다.
모델 카탈로그의 단일 진실원은 phase3/models-metadata.json 이며, baseline 우선순위는 phase3/model-version.json 으로 관리됩니다.
모델 카탈로그
| 표시명 | 파일명 | 클래스 | GPU 컨텍스트 | CPU 컨텍스트 | 호환성 등급 |
|---|---|---|---|---|---|
| Qwen3 8B (Q4_K_M) | Qwen3-8B-Q4_K_M.gguf | 8B | 40,960 | 16,384 | recommended (기본) |
| Qwen3 4B (Q4_K_M) | Qwen3-4B-Q4_K_M.gguf | 4B | 40,960 | 8,192 | compatible |
| Granite 4.0 Micro (Q4_K_M) | granite-4.0-micro-Q4_K_M.gguf | micro | 32,768 | 8,192 | experimental |
| Qwen3 1.7B (Q8_0) | Qwen3-1.7B-Q8_0.gguf | micro | 32,768 | 8,192 | experimental |
| Mistral 7B Instruct v0.3 (Q4_K_M) | Mistral-7B-Instruct-v0.3.Q4_K_M.gguf | 7B | 32,768 | 8,192 | compatible |
| Meta Llama 3.1 8B Instruct (Q4_K_M) | Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf | 8B | 32,768 | 16,384 | compatible |
호환성 등급 의미
- recommended: AIRGAP Studio 가 공식 권장하는 baseline 모델. 모든 어시스턴트 / Designer / Monitor 에서 최적 검증됨.
- compatible: 정상 동작이 검증된 모델. 일부 기능에서 응답 품질이 baseline 대비 다를 수 있음.
- experimental: 동작은 가능하나 응답 품질·안정성 검증이 제한적인 모델. 저사양 환경 폴백 용도.
모델 선택 가이드
| 환경 | 권장 모델 | 비고 |
|---|---|---|
| VRAM 4GB | Qwen3 1.7B (Q8_0) 또는 Granite 4.0 Micro | 경량 모델, 빠른 응답 |
| VRAM 6GB | Qwen3 4B (Q4_K_M) | 균형 잡힌 선택 |
| VRAM 8GB 이상 | Qwen3 8B (Q4_K_M) — 기본·권장 | Mistral 7B / Llama 3.1 8B 도 선택 가능 |
| CPU 전용 | Qwen3 1.7B 또는 Granite 4.0 Micro | RAM 16GB 이상 권장 |
상세 GPU/CPU 요구사항은 시스템 요구사항 문서를 참고하세요.
모델 자동 탐지
llama-server 는 build/vscodium/models/ 디렉토리의 .gguf 파일을 자동으로 인식합니다.
build/vscodium/models/
├── Qwen3-8B-Q4_K_M.gguf # 기본 동봉
├── Qwen3-4B-Q4_K_M.gguf # 추가 설치 시
└── Mistral-7B-Instruct-v0.3.Q4_K_M.gguf
새 모델을 배치한 후 AIRGAP Studio 를 재시작하면 모델 선택 UI 에 자동으로 추가됩니다.
모델 변경 방법
모델 전환은 Monitor 익스텐션 의 단독 책임입니다. 다른 어시스턴트는 현재 활성 모델을 표시만 합니다 (read-only).
- Command Palette 열기 (
Ctrl + Shift + P) AIRGAP: Select LLM Model명령 실행- QuickPick 에서 사용할 모델 선택
- llama-server 가 자동으로 재시작되며 새 모델이 로드됨
자세한 사용법은 Monitor 문서 를 참고하세요.
모델 다운로드
기본 동봉 (Qwen3 8B) 외 추가 모델은 별도의 Modelpack 인스톨러 로 배포됩니다.
- 다운로드: 공식 다운로드 페이지
- 오프라인 환경 배포 시 Modelpack
.exe를 함께 전달하면 됩니다.
관련 문서
- 시스템 요구사항 — GPU/CPU/VRAM 요구사항
- Compatibility Proxy — 모델별 chat format 정규화 게이트웨이
- Monitor 익스텐션 — 모델 선택 UI