mattbucci
/

gemma-4-26B-AWQ

4-bit precision

Model card Files Files and versions

gemma-4-26B-AWQ

Commit History

add quantization_config.ignore=1 (downstream audit fix)

06b09ed
verified

mattbucci commited on 9 days ago

Add files using upload-large-folder tool

ca05609
verified

mattbucci commited on 17 days ago

Replace INT4 vision with BF16 originals (model-00001-of-00001.safetensors)

a3f58d6
verified

mattbucci commited on 23 days ago

Replace INT4 vision with BF16 originals (config.json)

1503276
verified

mattbucci commited on 23 days ago

Replace INT4 vision with BF16 originals (model.safetensors.index.json)

1eb5076
verified

mattbucci commited on 23 days ago

Replace INT4 vision with BF16 originals (model-vision.safetensors)

66a15c0
verified

mattbucci commited on 23 days ago

Update vision status: untestable due to server crash

d47e216
verified

mattbucci commited on 23 days ago

Add known limitations (vision status)

08abe17
verified

mattbucci commited on 23 days ago

Add model card for Gemma 4 26B MoE AWQ 4-bit

7704836
verified

mattbucci commited on 23 days ago

Gemma 4 26B MoE AWQ: forced-routing GPTQ calibration for all 128 experts, 30 tok/s on RDNA4

5b529db
verified

mattbucci commited on 23 days ago

initial commit

4bbe8fa
verified

mattbucci commited on 23 days ago