지원 모델 | Airgap Studio

개요

AIRGAP Studio 는 인스톨러에 Qwen3-8B-Q4_K_M.gguf (baseline) 을 기본 동봉합니다. 추가 모델은 모델팩 인스톨러를 별도로 설치하거나, build/vscodium/models/ 디렉토리에 .gguf 파일을 직접 배치하면 자동으로 탐지됩니다.

모델 카탈로그의 단일 진실원은 phase3/models-metadata.json 이며, baseline 우선순위는 phase3/model-version.json 으로 관리됩니다.

모델 카탈로그

표시명	파일명	클래스	GPU 컨텍스트	CPU 컨텍스트	호환성 등급
Qwen3 8B (Q4_K_M)	`Qwen3-8B-Q4_K_M.gguf`	8B	40,960	16,384	recommended (기본)
Qwen3 4B (Q4_K_M)	`Qwen3-4B-Q4_K_M.gguf`	4B	40,960	8,192	compatible
Granite 4.0 Micro (Q4_K_M)	`granite-4.0-micro-Q4_K_M.gguf`	micro	32,768	8,192	experimental
Qwen3 1.7B (Q8_0)	`Qwen3-1.7B-Q8_0.gguf`	micro	32,768	8,192	experimental
Mistral 7B Instruct v0.3 (Q4_K_M)	`Mistral-7B-Instruct-v0.3.Q4_K_M.gguf`	7B	32,768	8,192	compatible
Meta Llama 3.1 8B Instruct (Q4_K_M)	`Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf`	8B	32,768	16,384	compatible

호환성 등급 의미

recommended: AIRGAP Studio 가 공식 권장하는 baseline 모델. 모든 어시스턴트 / Designer / Monitor 에서 최적 검증됨.

compatible: 정상 동작이 검증된 모델. 일부 기능에서 응답 품질이 baseline 대비 다를 수 있음.

experimental: 동작은 가능하나 응답 품질·안정성 검증이 제한적인 모델. 저사양 환경 폴백 용도.

모델 선택 가이드

환경	권장 모델	비고
VRAM 4GB	Qwen3 1.7B (Q8_0) 또는 Granite 4.0 Micro	경량 모델, 빠른 응답
VRAM 6GB	Qwen3 4B (Q4_K_M)	균형 잡힌 선택
VRAM 8GB 이상	Qwen3 8B (Q4_K_M) — 기본·권장	Mistral 7B / Llama 3.1 8B 도 선택 가능
CPU 전용	Qwen3 1.7B 또는 Granite 4.0 Micro	RAM 16GB 이상 권장

상세 GPU/CPU 요구사항은 시스템 요구사항 문서를 참고하세요.

모델 자동 탐지

llama-server 는 build/vscodium/models/ 디렉토리의 .gguf 파일을 자동으로 인식합니다.

build/vscodium/models/
├── Qwen3-8B-Q4_K_M.gguf           # 기본 동봉
├── Qwen3-4B-Q4_K_M.gguf           # 추가 설치 시
└── Mistral-7B-Instruct-v0.3.Q4_K_M.gguf

새 모델을 배치한 후 AIRGAP Studio 를 재시작하면 모델 선택 UI 에 자동으로 추가됩니다.

모델 변경 방법

모델 전환은 Monitor 익스텐션 의 단독 책임입니다. 다른 어시스턴트는 현재 활성 모델을 표시만 합니다 (read-only).

Command Palette 열기 (Ctrl + Shift + P)
AIRGAP: Select LLM Model 명령 실행
QuickPick 에서 사용할 모델 선택
llama-server 가 자동으로 재시작되며 새 모델이 로드됨

자세한 사용법은 Monitor 문서 를 참고하세요.

모델 다운로드

기본 동봉 (Qwen3 8B) 외 추가 모델은 별도의 Modelpack 인스톨러 로 배포됩니다.

다운로드: 공식 다운로드 페이지
오프라인 환경 배포 시 Modelpack .exe 를 함께 전달하면 됩니다.

개요

모델 카탈로그

모델 선택 가이드

모델 자동 탐지

모델 변경 방법

모델 다운로드

관련 문서