Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
Log In
Sign Up

inference-optimization
/

DeepSeek-V4-Flash-5layers-nvfp4moe

8-bit precision

compressed-tensors

Model card Files Files and versions

DeepSeek-V4-Flash-5layers-nvfp4moe

21.5 GB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

kylesayrs's picture

Upload folder using huggingface_hub

e378b44 verified 9 days ago

.gitattributes

1.52 kB
initial commit 9 days ago
config.json

6.96 kB
Upload folder using huggingface_hub 9 days ago
generation_config.json

174 Bytes
Upload folder using huggingface_hub 9 days ago
model.safetensors

21.5 GB
xet

Upload folder using huggingface_hub 9 days ago
recipe.yaml

1.23 kB
Upload folder using huggingface_hub 9 days ago
tokenizer.json

10.1 MB
Upload folder using huggingface_hub 9 days ago
tokenizer_config.json

397 Bytes
Upload folder using huggingface_hub 9 days ago