add quantization_config.ignore=['lm_head', 're:.mlp\\.gate$', 're:.linear_attn\\.in_proj_a$', 're:.linear_attn\\.in_proj_b$', 're:.shared_expert\\..*']

Files changed (1) hide show

config.json CHANGED Viewed

@@ -114,6 +114,13 @@
       "norm",
       "k_norm",
       "q_norm"
     ]
   },
   "rms_norm_eps": 1e-06,

       "norm",
       "k_norm",
       "q_norm"
+    ],
+    "ignore": [
+      "lm_head",
+      "re:.*mlp\\.gate$",
+      "re:.*linear_attn\\.in_proj_a$",
+      "re:.*linear_attn\\.in_proj_b$",
+      "re:.*shared_expert\\..*"
     ]
   },
   "rms_norm_eps": 1e-06,

add quantization_config.ignore=['lm_head', 're:.*mlp\\.gate$', 're:.*linear_attn\\.in_proj_a$', 're:.*linear_attn\\.in_proj_b$', 're:.*shared_expert\\..*']