inference-optimization
/

MiniMax-M2.5-NVFP4

@@ -113,7 +113,8 @@
         "targets": [
           "re:.*block_sparse_moe\\.experts\\.\\d+\\.w1$",
           "re:.*block_sparse_moe\\.experts\\.\\d+\\.w2$",
-          "re:.*block_sparse_moe\\.experts\\.\\d+\\.w3$"
         ],
         "weights": {
           "actorder": null,
@@ -468,4 +469,4 @@
   "use_qk_norm": true,
   "use_routing_bias": true,
   "vocab_size": 200064
-}

         "targets": [
           "re:.*block_sparse_moe\\.experts\\.\\d+\\.w1$",
           "re:.*block_sparse_moe\\.experts\\.\\d+\\.w2$",
+          "re:.*block_sparse_moe\\.experts\\.\\d+\\.w3$",
+          "re:.*mlp\\.experts\\.\\d+\\.(gate|up|gate_up|down)_proj$"
         ],
         "weights": {
           "actorder": null,
   "use_qk_norm": true,
   "use_routing_bias": true,
   "vocab_size": 200064
+}