`google/gemma-4-31B-it`, UQFF quantization

Run with mistral.rs. Documentation: UQFF docs.

Flexible 🌀: Multiple quantization formats in one file format with one framework to run them all.
Reliable 🔒: Compatibility ensured with embedded and checked semantic versioning information from day 1.
Easy 🤗: Download UQFF models easily and quickly from Hugging Face, or use a local file.
Customizable 🛠️: Make and publish your own UQFF files in minutes.

Install

Linux/macOS:

curl --proto '=https' --tlsv1.2 -sSf https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.sh | sh

Windows (PowerShell):

irm https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.ps1 | iex

With an image:

mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff 8 --image image.png -i "Describe this image in detail."

With a video:

mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff 8 --video video.mp4 -i "Describe this video in detail."

Note: AFQ variants are optimized for Apple Silicon / Metal.

Quantization	Command
AFQ2	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff afq2-0.uqff`
AFQ3	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff afq3-0.uqff`
AFQ4	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff afq4-0.uqff`
AFQ6	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff afq6-0.uqff`
AFQ8	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff afq8-0.uqff`
Q2K	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff q2k-0.uqff`
Q3K	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff q3k-0.uqff`
Q4K	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff q4k-0.uqff`
Q5K	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff q5k-0.uqff`
Q6K	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff q6k-0.uqff`
Q8_0	`mistralrs run -m mistralrs-community/gemma-4-31B-it-UQFF --from-uqff q8_0-0.uqff`

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Quantized

(107)

this model