Youssofal
/

Gemma4-MTPLX-Optimized-Quality

Text Generation

speculative-decoding

Model card Files Files and versions

Gemma4-MTPLX-Optimized-Quality / mtplx_pair.json

Youssofal's picture

Add files using upload-large-folder tool

77ba53c verified 18 days ago

history blame contribute delete

1.19 kB

	{
	"format_version": 1,
	"name": "Gemma4 MTPLX Optimized Quality",
	"variant": "quality",
	"layout": {
	"target": "target",
	"assistant": "assistant"
	},
	"source": {
	"target_repo": "google/gemma-4-31B-it",
	"target_revision": "145dc2508c480a64b47242f160d286cff94a2343",
	"assistant_repo": "google/gemma-4-31B-it-assistant",
	"assistant_revision": "cffbbd2cea41ea56a0fa5b0487e0d445121fd204"
	},
	"target": {
	"role": "verifier",
	"model_type": "gemma4",
	"quantization": {
	"bits": 8,
	"group_size": 64,
	"mode": "affine"
	}
	},
	"assistant": {
	"role": "drafter",
	"model_type": "gemma4_assistant",
	"quantization": {
	"bits": 8,
	"group_size": 64,
	"mode": "affine"
	}
	},
	"benchmark": {
	"prompt_suite": "flappy",
	"max_tokens": 1000,
	"temperature": 1.0,
	"top_p": 0.95,
	"top_k": 64,
	"seed": 0,
	"best_block_size": 6,
	"acceptance": {
	"accepted": 833,
	"drafted": 835,
	"ratio": 0.9976047904191617
	},
	"observed_mtp_tok_s": [
	34.22416818179891,
	32.87803735799434,
	33.11645340400705
	],
	"speedup_vs_ar": 2.491870791785778
	}
	}