Jake5
/

Qwen2.5-Coder-32B-Instruct-WMX

text-generation-inference

Model card Files Files and versions

Jake5 commited on Sep 8, 2025

Commit

9e24005

·

verified ·

1 Parent(s): 70a1567

Update model card for v0.5

Files changed (1) hide show

README.md +5 -17

README.md CHANGED Viewed

@@ -1,15 +1,3 @@
----
-base_model: unsloth/Qwen2.5-Coder-32B-Instruct-bnb-4bit
-tags:
-- text-generation-inference
-- transformers
-- unsloth
-- qwen2
-- trl
-license: apache-2.0
-language:
-- en
----
 # Qwen2.5-Coder-32B-Instruct-WMX
 Pre-fine-tuned LoRA adapters for unsloth/Qwen2.5-Coder-32B-Instruct.
@@ -19,25 +7,25 @@ Pre-fine-tuned LoRA adapters for unsloth/Qwen2.5-Coder-32B-Instruct.
 - https://huggingface.co/datasets/Jake5/wmx-doc-user
 - https://huggingface.co/datasets/Jake5/wmx-doc-robot
-## Version v0.4
 - Source: lora_model
 - Base model: unsloth/Qwen2.5-Coder-32B-Instruct
-- Uploaded on: 2025-09-05
 ## Usage
 ```python
 from peft import PeftModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 base_model = AutoModelForCausalLM.from_pretrained("unsloth/Qwen2.5-Coder-32B-Instruct")
-model = PeftModel.from_pretrained(base_model, "Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.4")
-tokenizer = AutoTokenizer.from_pretrained("Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.4")
 ```
 ## vLLM Serving
 ```bash
 python -m vllm.entrypoints.openai.api_server \
     --model unsloth/Qwen2.5-Coder-32B-Instruct \
-    --lora-modules my-lora=Jake5/Qwen2.5-Coder-32B-Instruct-WMX/adapters_v0.4 \
     --dtype bfloat16 \
     --port 8000
 ```

 # Qwen2.5-Coder-32B-Instruct-WMX
 Pre-fine-tuned LoRA adapters for unsloth/Qwen2.5-Coder-32B-Instruct.
 - https://huggingface.co/datasets/Jake5/wmx-doc-user
 - https://huggingface.co/datasets/Jake5/wmx-doc-robot
+## Version v0.5
 - Source: lora_model
 - Base model: unsloth/Qwen2.5-Coder-32B-Instruct
+- Uploaded on: 2025-09-08
 ## Usage
 ```python
 from peft import PeftModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 base_model = AutoModelForCausalLM.from_pretrained("unsloth/Qwen2.5-Coder-32B-Instruct")
+model = PeftModel.from_pretrained(base_model, "Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.5")
+tokenizer = AutoTokenizer.from_pretrained("Jake5/Qwen2.5-Coder-32B-Instruct-WMX", subfolder="adapters_v0.5")
 ```
 ## vLLM Serving
 ```bash
 python -m vllm.entrypoints.openai.api_server \
     --model unsloth/Qwen2.5-Coder-32B-Instruct \
+    --lora-modules my-lora=Jake5/Qwen2.5-Coder-32B-Instruct-WMX/adapters_v0.5 \
     --dtype bfloat16 \
     --port 8000
 ```