oshkorinova
/

MamayLM-Gemma-3-12B-IT-v1.0-FP8-Dynamic

Text Generation

image-text-to-text

text-generation-inference

compressed-tensors

Model card Files Files and versions

MamayLM Gemma 3 12B — FP8 Dynamic

FP8 static quantized from INSAIT-Institute/MamayLM-Gemma-3-12B-IT-v1.0 using llmcompressor.

Usage

Designed for vLLM inference (H100).
trust_remote_code=True.

Downloads last month: 16

Safetensors

Model size

12B params

Tensor type

BF16

·

F8_E4M3

·

Model tree for oshkorinova/MamayLM-Gemma-3-12B-IT-v1.0-FP8-Dynamic

Base model

google/gemma-3-12b-pt

Finetuned

google/gemma-3-12b-it

Finetuned

INSAIT-Institute/MamayLM-Gemma-3-12B-IT-v1.0

Quantized

(6)

this model