AIRGAP StudioAIRGAP Studio

지원 모델

AIRGAP Studio 가 지원하는 6종 AI 모델 카탈로그

개요

AIRGAP Studio 는 인스톨러에 Qwen3-8B-Q4_K_M.gguf (baseline) 을 기본 동봉합니다. 추가 모델은 모델팩 인스톨러를 별도로 설치하거나, build/vscodium/models/ 디렉토리에 .gguf 파일을 직접 배치하면 자동으로 탐지됩니다.

모델 카탈로그의 단일 진실원은 phase3/models-metadata.json 이며, baseline 우선순위는 phase3/model-version.json 으로 관리됩니다.

모델 카탈로그

표시명파일명클래스GPU 컨텍스트CPU 컨텍스트호환성 등급
Qwen3 8B (Q4_K_M)Qwen3-8B-Q4_K_M.gguf8B40,96016,384recommended (기본)
Qwen3 4B (Q4_K_M)Qwen3-4B-Q4_K_M.gguf4B40,9608,192compatible
Granite 4.0 Micro (Q4_K_M)granite-4.0-micro-Q4_K_M.ggufmicro32,7688,192experimental
Qwen3 1.7B (Q8_0)Qwen3-1.7B-Q8_0.ggufmicro32,7688,192experimental
Mistral 7B Instruct v0.3 (Q4_K_M)Mistral-7B-Instruct-v0.3.Q4_K_M.gguf7B32,7688,192compatible
Meta Llama 3.1 8B Instruct (Q4_K_M)Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf8B32,76816,384compatible

호환성 등급 의미

  • recommended: AIRGAP Studio 가 공식 권장하는 baseline 모델. 모든 어시스턴트 / Designer / Monitor 에서 최적 검증됨.
  • compatible: 정상 동작이 검증된 모델. 일부 기능에서 응답 품질이 baseline 대비 다를 수 있음.
  • experimental: 동작은 가능하나 응답 품질·안정성 검증이 제한적인 모델. 저사양 환경 폴백 용도.

모델 선택 가이드

환경권장 모델비고
VRAM 4GBQwen3 1.7B (Q8_0) 또는 Granite 4.0 Micro경량 모델, 빠른 응답
VRAM 6GBQwen3 4B (Q4_K_M)균형 잡힌 선택
VRAM 8GB 이상Qwen3 8B (Q4_K_M) — 기본·권장Mistral 7B / Llama 3.1 8B 도 선택 가능
CPU 전용Qwen3 1.7B 또는 Granite 4.0 MicroRAM 16GB 이상 권장

상세 GPU/CPU 요구사항은 시스템 요구사항 문서를 참고하세요.

모델 자동 탐지

llama-server 는 build/vscodium/models/ 디렉토리의 .gguf 파일을 자동으로 인식합니다.

build/vscodium/models/
├── Qwen3-8B-Q4_K_M.gguf           # 기본 동봉
├── Qwen3-4B-Q4_K_M.gguf           # 추가 설치 시
└── Mistral-7B-Instruct-v0.3.Q4_K_M.gguf

새 모델을 배치한 후 AIRGAP Studio 를 재시작하면 모델 선택 UI 에 자동으로 추가됩니다.

모델 변경 방법

모델 전환은 Monitor 익스텐션 의 단독 책임입니다. 다른 어시스턴트는 현재 활성 모델을 표시만 합니다 (read-only).

  1. Command Palette 열기 (Ctrl + Shift + P)
  2. AIRGAP: Select LLM Model 명령 실행
  3. QuickPick 에서 사용할 모델 선택
  4. llama-server 가 자동으로 재시작되며 새 모델이 로드됨

자세한 사용법은 Monitor 문서 를 참고하세요.

모델 다운로드

기본 동봉 (Qwen3 8B) 외 추가 모델은 별도의 Modelpack 인스톨러 로 배포됩니다.

관련 문서