Gemma 4 QAT 모델이 모바일과 노트북의 성능 최적화를 이루었다.
Gemma 4의 양자화 인식 학습(QAT) 체크포인트는 에지 기기와 소비자용 GPU에서 메모리 요구량을 줄이고 성능을 최적화한다. QAT는 학습 과정에서 양자화를 시뮬레이션하여 압축 시 품질 손실을 줄인다. 이로 인해 standard PTQ 기준선보다 더 높은 품질을 제공한다.
The Gemma 4 QAT model optimizes performance for mobile and laptops.
The Gemma 4 quantization-aware training (QAT) checkpoint enhances memory requirements and on-device performance for edge devices and consumer GPUs. QAT simulates quantization during training to reduce quality loss during compression. This results in overall quality that exceeds standard PTQ baselines.