Models

28,298

Full-text search

Active filters: 8-bit

HF1BitLLM/Llama3-8B-1.58-100B-tokens

Text Generation • 3B • Updated Sep 19, 2024 • 2.34k • 211

MaziyarPanahi/Llama-3.2-3B-Instruct-GGUF

Text Generation • 3B • Updated Sep 25, 2024 • 85.9k • 15

lmstudio-community/Qwen2.5-Coder-14B-Instruct-MLX-8bit

Text Generation • 4B • Updated Nov 13, 2024 • 106k • 2

mlx-community/DeepSeek-R1-Distill-Llama-8B-8bit

2B • Updated Feb 26, 2025 • 131 • 4

nvidia/DeepSeek-R1-NVFP4

Text Generation • 397B • Updated Jun 6, 2025 • 4.41k • 277

MaziyarPanahi/Phi-4-mini-instruct-GGUF

Text Generation • 4B • Updated Mar 1, 2025 • 92k • 12

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 46.3k • 30

nvidia/DeepSeek-V3-0324-NVFP4

Text Generation • 397B • Updated Aug 22, 2025 • 38.5k • 17

lmstudio-community/DeepSeek-R1-0528-Qwen3-8B-MLX-8bit

Text Generation • 2B • Updated May 29, 2025 • 323k • 16

nvidia/DeepSeek-R1-0528-NVFP4

Text Generation • 397B • Updated Aug 22, 2025 • 6.6k • 44

mlx-community/DiffuCoder-7B-cpGRPO-8bit

Text Generation • 8B • Updated Jul 4, 2025 • 93 • 9

nvidia/Qwen3-235B-A22B-NVFP4

Text Generation • 133B • Updated Jul 8, 2025 • 9.68k • 16

mlx-community/SmolLM3-3B-8bit

Text Generation • Updated Jul 8, 2025 • 95 • 9

nvidia/DeepSeek-R1-NVFP4-v2

Text Generation • 394B • Updated Jul 22, 2025 • 6.07k • 7

mlx-community/GLM-4.5-Air-8bit

Text Generation • 107B • Updated Jul 29, 2025 • 2.31k • 9

lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-MLX-8bit

Text Generation • 31B • Updated Jul 31, 2025 • 200k • 15

ramblingpolymath/Qwen3-Coder-30B-A3B-Instruct-W8A8

Text Generation • 31B • Updated Aug 2, 2025 • 437 • 3

unsloth/gpt-oss-120b

Text Generation • 120B • Updated Aug 9, 2025 • 54.2k • 21

huizimao/gpt-oss-20b-helpful-MXFP4-QAT

21B • Updated Aug 28, 2025 • 2

nvidia/Phi-4-reasoning-plus-NVFP4

8B • Updated Sep 5, 2025 • 1.38k • 9

nvidia/Llama-3.1-8B-Instruct-NVFP4

5B • Updated Sep 15, 2025 • 118k • 9

nvidia/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Sep 9, 2025 • 29.1k • 17

nvidia/Qwen3-14B-NVFP4

Text Generation • 8B • Updated Sep 9, 2025 • 31.1k • 8

nvidia/Qwen3-32B-NVFP4

Text Generation • 17B • Updated Sep 9, 2025 • 127k • 15

nvidia/Qwen2.5-VL-7B-Instruct-NVFP4

Text Generation • 5B • Updated Dec 6, 2025 • 24.1k • 15

xxrjun/gpt-oss-120b-mxfp4

120B • Updated Sep 27, 2025 • 16 • 1

RedHatAI/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Nov 21, 2025 • 2.37k • 2

nvidia/Llama-3_3-Nemotron-Super-49B-v1_5-NVFP4

Text Generation • 26B • Updated Nov 27, 2025 • 13.9k • 17

MaziyarPanahi/VibeThinker-1.5B-GGUF

Text Generation • 2B • Updated Nov 20, 2025 • 452 • 36

lmstudio-community/Olmo-3-7B-Instruct-MLX-8bit

7B • Updated Nov 20, 2025 • 332 • 1