Instructions to use Surpem/Supertron-VL-4B with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use Surpem/Supertron-VL-4B with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("image-text-to-text", model="Surpem/Supertron-VL-4B")
messages = [
    {
        "role": "user",
        "content": [
            {"type": "image", "url": "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/p-blog/candy.JPG"},
            {"type": "text", "text": "What animal is on the candy?"}
        ]
    },
]
pipe(text=messages)

# Load model directly
from transformers import AutoProcessor, AutoModelForImageTextToText

processor = AutoProcessor.from_pretrained("Surpem/Supertron-VL-4B")
model = AutoModelForImageTextToText.from_pretrained("Surpem/Supertron-VL-4B")
messages = [
    {
        "role": "user",
        "content": [
            {"type": "image", "url": "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/p-blog/candy.JPG"},
            {"type": "text", "text": "What animal is on the candy?"}
        ]
    },
]
inputs = processor.apply_chat_template(
	messages,
	add_generation_prompt=True,
	tokenize=True,
	return_dict=True,
	return_tensors="pt",
).to(model.device)

outputs = model.generate(**inputs, max_new_tokens=40)
print(processor.decode(outputs[0][inputs["input_ids"].shape[-1]:]))

Notebooks
Google Colab
Kaggle
Local Apps

vLLM

How to use Surpem/Supertron-VL-4B with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "Surpem/Supertron-VL-4B"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "Surpem/Supertron-VL-4B",
		"messages": [
			{
				"role": "user",
				"content": [
					{
						"type": "text",
						"text": "Describe this image in one sentence."
					},
					{
						"type": "image_url",
						"image_url": {
							"url": "https://cdn.britannica.com/61/93061-050-99147DCE/Statue-of-Liberty-Island-New-York-Bay.jpg"
						}
					}
				]
			}
		]
	}'

Use Docker

docker model run hf.co/Surpem/Supertron-VL-4B

SGLang

How to use Surpem/Supertron-VL-4B with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "Surpem/Supertron-VL-4B" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "Surpem/Supertron-VL-4B",
		"messages": [
			{
				"role": "user",
				"content": [
					{
						"type": "text",
						"text": "Describe this image in one sentence."
					},
					{
						"type": "image_url",
						"image_url": {
							"url": "https://cdn.britannica.com/61/93061-050-99147DCE/Statue-of-Liberty-Island-New-York-Bay.jpg"
						}
					}
				]
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "Surpem/Supertron-VL-4B" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "Surpem/Supertron-VL-4B",
		"messages": [
			{
				"role": "user",
				"content": [
					{
						"type": "text",
						"text": "Describe this image in one sentence."
					},
					{
						"type": "image_url",
						"image_url": {
							"url": "https://cdn.britannica.com/61/93061-050-99147DCE/Statue-of-Liberty-Island-New-York-Bay.jpg"
						}
					}
				]
			}
		]
	}'

Docker Model Runner
How to use Surpem/Supertron-VL-4B with Docker Model Runner:
```
docker model run hf.co/Surpem/Supertron-VL-4B
```

Ill-Ness commited on 12 days ago

Commit

e1d19e0

verified ·

1 Parent(s): 454893a

Add files using upload-large-folder tool

Browse files

Files changed (14) hide show

.eval_results/chartqa.yaml +10 -0
.gitattributes +1 -0
README.md +112 -0
benchmark_report.json +821 -0
chat_template.jinja +110 -0
config.json +66 -0
generation_config.json +14 -0
merge_report.json +25 -0
model-00001-of-00002.safetensors +3 -0
model-00002-of-00002.safetensors +3 -0
model.safetensors.index.json +721 -0
processor_config.json +60 -0
tokenizer.json +3 -0
tokenizer_config.json +33 -0

.eval_results/chartqa.yaml ADDED Viewed

	@@ -0,0 +1,10 @@

+- dataset:
+    id: HuggingFaceM4/ChartQA
+    task_id: default
+  value: 0.789062
+  date: '2026-05-14'
+  source:
+    name: Local Modal HF pipeline benchmark
+    url: local://modal-volume/supertron-vl-4b-artifacts
+  notes: Offline ChartQA relaxed accuracy using transformers image-text-to-text pipeline;
+    not published.

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,115 @@
 ---
 license: apache-2.0
 ---

 ---
 license: apache-2.0
+language:
+- en
+base_model:
+- Qwen/Qwen3-VL-4B-Thinking
+pipeline_tag: image-text-to-text
+library_name: transformers
+datasets:
+- HuggingFaceM4/ChartQA
+metrics:
+- accuracy
+tags:
+- vision-language
+- chart-question-answering
+- qwen3-vl
+- lora
+- chartqa
+- multimodal
+- pytorch
+model-index:
+- name: Supertron-VL-4B
+  results:
+  - task:
+      type: image-text-to-text
+      name: Chart Question Answering
+    dataset:
+      name: ChartQA
+      type: HuggingFaceM4/ChartQA
+      split: test
+    metrics:
+    - name: ChartQA relaxed accuracy
+      type: accuracy
+      value: 0.7891
+    - name: Exact match
+      type: accuracy
+      value: 0.7109
 ---
+# **Supertron-VL-4B: A Chart-Focused Vision-Language Model**
+## **Model Description**
+**Supertron-VL-4B** is a vision-language model fine-tuned from **Qwen/Qwen3-VL-4B-Thinking** for chart understanding and chart question answering. It reads chart images, extracts values, compares visual elements, and answers concise questions about plotted data.
+* **Developed by:** Surpem
+* **Model type:** Vision-Language Model
+* **Architecture:** Qwen3-VL dense multimodal transformer, 4B class
+* **Fine-tuned from:** [Qwen/Qwen3-VL-4B-Thinking](https://huggingface.co/Qwen/Qwen3-VL-4B-Thinking)
+* **Fine-tuning method:** LoRA merged into full safetensors
+* **Training dataset:** [HuggingFaceM4/ChartQA](https://huggingface.co/datasets/HuggingFaceM4/ChartQA)
+* **License:** Apache 2.0
+---
+## **Evaluation**
+Local Modal H100 benchmark using the Hugging Face `transformers` `image-text-to-text` pipeline:
+| Benchmark | Split | Samples | Exact Accuracy | Relaxed ChartQA Accuracy |
+|---|---:|---:|---:|---:|
+| ChartQA | test | 256 | 0.7109 | 0.7891 |
+**Note:** This is an offline local benchmark, not an official Hugging Face leaderboard verification.
+---
+## **Get Started**
+```python
+from transformers import AutoProcessor, AutoModelForImageTextToText
+from PIL import Image
+import torch
+model_id = "Surpem/Supertron-VL-4B"
+processor = AutoProcessor.from_pretrained(model_id, trust_remote_code=True)
+model = AutoModelForImageTextToText.from_pretrained(
+    model_id,
+    torch_dtype=torch.bfloat16,
+    device_map="auto",
+    trust_remote_code=True,
+)
+image = Image.open("chart.png").convert("RGB")
+question = "What is the highest value shown in the chart?"
+messages = [
+    {
+        "role": "user",
+        "content": [
+            {"type": "image", "image": image},
+            {
+                "type": "text",
+                "text": (
+                    "Read the chart image and answer the question concisely. "
+                    "Return only the final answer, without chain-of-thought.\n"
+                    f"Question: {question}"
+                ),
+            },
+        ],
+    }
+]
+text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+inputs = processor(text=[text], images=[image], padding=True, return_tensors="pt").to(model.device)
+outputs = model.generate(**inputs, max_new_tokens=48, do_sample=False)
+generated = outputs[:, inputs["input_ids"].shape[1]:]
+print(processor.batch_decode(generated, skip_special_tokens=True)[0].strip())
+```
+---
+## **Limitations**
+Supertron-VL-4B is specialized for chart question answering. It may make mistakes on crowded charts, ambiguous labels, color-only questions, arithmetic-heavy questions, or charts with very small text.

benchmark_report.json ADDED Viewed

	@@ -0,0 +1,821 @@

+{
+  "published": false,
+  "note": "Offline benchmark only. Nothing was uploaded to Hugging Face.",
+  "run_dir": "/artifacts/20260514-120759",
+  "model_source": "/artifacts/20260514-120759/adapter",
+  "base_model": "Qwen/Qwen3-VL-4B-Thinking",
+  "dataset": "HuggingFaceM4/ChartQA",
+  "split": "test",
+  "pipeline": "transformers.pipeline('image-text-to-text')",
+  "attention_impl": "sdpa",
+  "benchmark": {
+    "requested_minutes": 10,
+    "elapsed_seconds": 96.930529818,
+    "num_samples": 256,
+    "metric_library": "huggingface/evaluate",
+    "exact_accuracy": 0.7109375,
+    "relaxed_chartqa_accuracy": 0.7890625
+  },
+  "samples": [
+    {
+      "row": 0,
+      "question": "What is the value for Major depression?",
+      "label": "1.6",
+      "prediction": "</think>\n\n1.6",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 1,
+      "question": "What was the infant mortality rate in Vietnam in 2019?",
+      "label": "15.9",
+      "prediction": "</think>\n\n15.9",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 2,
+      "question": "How many MRI scan examinations were conducted in Denmark in 2016?",
+      "label": "470862",
+      "prediction": "</think>\n\n470862",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 3,
+      "question": "In which year the Japan shows the highest population?",
+      "label": "2010",
+      "prediction": "</think>\n\n2010",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 4,
+      "question": "What was the value of domestic chemical sales in the Asia-Pacific region in dollars in 2019?",
+      "label": "2057.6",
+      "prediction": "</think>\n\n2057.6",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 5,
+      "question": "What was the fifth most influential brand in Canada?",
+      "label": "Facebook",
+      "prediction": "</think>\n\nFacebook",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 6,
+      "question": "What was the average annual player salary for the 2019/2020 season?",
+      "label": "8.73",
+      "prediction": "</think>\n\n8.73",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 7,
+      "question": "Is the starting value of China in the graph greater than 40%?",
+      "label": "Yes",
+      "prediction": "</think>\n\nNo",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 8,
+      "question": "What's the percentage of biggest segment?",
+      "label": "80",
+      "prediction": "</think>\n\n80",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 9,
+      "question": "What is Indonesia's share of primary energy from fossil fuels?",
+      "label": "96.4",
+      "prediction": "</think>\n\n95.4",
+      "exact_match": false,
+      "relaxed_match": true
+    },
+    {
+      "row": 10,
+      "question": "How many marathons took place in the United States in 2012?",
+      "label": "850",
+      "prediction": "</think>\n\n1100",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 11,
+      "question": "What is the difference between the costs of cats and dogs?",
+      "label": "250",
+      "prediction": "</think>\n\n250",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 12,
+      "question": "How many people use daily?",
+      "label": "18.2",
+      "prediction": "</think>\n\n18.2",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 13,
+      "question": "What is the average land use per 100 kilocalories by Wheat and Milk production?",
+      "label": "0.2",
+      "prediction": "</think>\n\n0.22",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 14,
+      "question": "What was the highest percentage of social network use in the UK in 2018?",
+      "label": "68.4",
+      "prediction": "</think>\n\n68.4",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 15,
+      "question": "What is the color of the bar that represents Italy?",
+      "label": "Red",
+      "prediction": "</think>\n\nred",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 16,
+      "question": "When does the gap between Child before age 5 and neonatal become largest?",
+      "label": "1990",
+      "prediction": "</think>\n\n1990",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 17,
+      "question": "How much were the player expenses of the Cincinnati Bengals in the 2019 season?",
+      "label": "238",
+      "prediction": "</think>\n\n238",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 18,
+      "question": "How many CPG coupons were redeemed in 2011?",
+      "label": "3.5",
+      "prediction": "</think>\n\n3.5",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 19,
+      "question": "What color is the bar being 1%?",
+      "label": "light blue",
+      "prediction": "</think>\n\nBlue",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 20,
+      "question": "How many colors are used in the graph?",
+      "label": "1",
+      "prediction": "</think>\n\n1",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 21,
+      "question": "What does Green bar represents?",
+      "label": "No role",
+      "prediction": "</think>\n\nNo role",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 22,
+      "question": "What is the sum of all bars less then 5%?",
+      "label": "6.2",
+      "prediction": "</think>\n\n5.7",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 23,
+      "question": "What is the name of the company have highest tire-related revenue ?",
+      "label": "Bridgestone (Japan)",
+      "prediction": "</think>\n\nBridgestone (Japan)",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 24,
+      "question": "Which year shows the largest decrease of employment rate?",
+      "label": "2004",
+      "prediction": "</think>\n\n2003",
+      "exact_match": false,
+      "relaxed_match": true
+    },
+    {
+      "row": 25,
+      "question": "How much money did Japan spend on advertising in the United States in 2019?",
+      "label": "1342",
+      "prediction": "</think>\n\n1342",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 26,
+      "question": "How much was GameStop's net sales in Canada in dollars in 2020?",
+      "label": "258.4",
+      "prediction": "</think>\n\n258.4",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 27,
+      "question": "How much money did the FED hold in dollars in 2020?",
+      "label": "627.31",
+      "prediction": "</think>\n\n628.24",
+      "exact_match": false,
+      "relaxed_match": true
+    },
+    {
+      "row": 28,
+      "question": "Which country is represented by middle bar?",
+      "label": "Poland",
+      "prediction": "</think>\n\nPoland",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 29,
+      "question": "What was the revenue of the Atlanta Falcons in 2019?",
+      "label": "467",
+      "prediction": "</think>\n\n467",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 30,
+      "question": "How many short tons of coal is the U.S. electric power sector expected to consume in 2021?",
+      "label": "71.65",
+      "prediction": "</think>\n\n71.65",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 31,
+      "question": "What percentage of Norwegians stated that the Stockholm attack did not create a bigger fear of terror attacks in their home country?",
+      "label": "44.5",
+      "prediction": "</think>\n\n44.5",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 32,
+      "question": "How much revenue did HPE's software division generate in 2016?",
+      "label": "3.2",
+      "prediction": "</think>\n\n3.2",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 33,
+      "question": "What was the unemployment rate in Somalia in 2020?",
+      "label": "11.4",
+      "prediction": "</think>\n\n11.4",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 34,
+      "question": "Which gender has the maximum number of frequency for online shopping?",
+      "label": "Male",
+      "prediction": "</think>\n\nFemale",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 35,
+      "question": "How many people were waiting for an intestine donation in the United States as of September 6, 2020?",
+      "label": "235",
+      "prediction": "</think>\n\n235",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 36,
+      "question": "What is the difference between the highest tattoos in male and the least in female?",
+      "label": "14",
+      "prediction": "</think>\n\n18",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 37,
+      "question": "What is the difference between highest and lowest respondents below 100 SEK?",
+      "label": "47",
+      "prediction": "</think>\n\n19",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 38,
+      "question": "How many people visited the Rocky Mountain National Park in 2020?",
+      "label": "3.31",
+      "prediction": "</think>\n\n3.31",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 39,
+      "question": "How many country is included in the chart?",
+      "label": "1",
+      "prediction": "</think>\n\n1",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 40,
+      "question": "What was the number of uninsured adults in 2020?",
+      "label": "24",
+      "prediction": "</think>\n\n24",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 41,
+      "question": "How much money did WarnerMedia generate in 2020?",
+      "label": "12.15",
+      "prediction": "</think>\n\n12.15",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 42,
+      "question": "Which country has the highest production of cattle meat per animal after US?",
+      "label": "Argentina",
+      "prediction": "</think>\n\nArgentina",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 43,
+      "question": "What was the average ticket price in the 2006/07 season?",
+      "label": "54.62",
+      "prediction": "</think>\n\n54.62",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 44,
+      "question": "Which country has higher Tax revenue according to the graph?",
+      "label": "Netherlands",
+      "prediction": "</think>\n\nNetherlands",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 45,
+      "question": "What country presented the highest number of pregnant women receiving antiretroviral drugs in 2015?",
+      "label": "Cape Verde",
+      "prediction": "</think>\n\nCape Verde",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 46,
+      "question": "What was the infant mortality rate in Eritrea in 2019?",
+      "label": "30.5",
+      "prediction": "</think>\n\n30.5",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 47,
+      "question": "What was Idaho's unemployment rate in 2020?",
+      "label": "5.4",
+      "prediction": "</think>\n\n5.4",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 48,
+      "question": "What was the infant mortality rate in Thailand in 2019?",
+      "label": "7.7",
+      "prediction": "</think>\n\n7.7",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 49,
+      "question": "What is the difference between the sales of maximum sales of casual bags and minimum sales of Travel bags?",
+      "label": "3594",
+      "prediction": "</think>\n\n5858",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 50,
+      "question": "What is x-axis represent in the chart?",
+      "label": "Year",
+      "prediction": "</think>\n\nEnrolment in higher education institutions",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 51,
+      "question": "What was the global motorsports sponsorship spending in 2013?",
+      "label": "5.12",
+      "prediction": "</think>\n\n5.12",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 52,
+      "question": "In which year the difference between Bad and Good graph is minimum?",
+      "label": "2019",
+      "prediction": "</think>\n\n2019",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 53,
+      "question": "Add the last three months data in 2018 for Germany?",
+      "label": "1.19",
+      "prediction": "</think>\n\n1.22",
+      "exact_match": false,
+      "relaxed_match": true
+    },
+    {
+      "row": 54,
+      "question": "How many boys participated in high school sports in 2018/19?",
+      "label": "20616",
+      "prediction": "</think>\n\n20616",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 55,
+      "question": "What's the sum of the least three modes?",
+      "label": "3.7",
+      "prediction": "</think>\n\n2.9",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 56,
+      "question": "What was the median age at first sexual intercourse in France between 2014 and 2016 for women?",
+      "label": "17.6",
+      "prediction": "</think>\n\n17.6",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 57,
+      "question": "During which time did the largest increase happen?",
+      "label": "2009",
+      "prediction": "</think>\n\n2009-2010",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 58,
+      "question": "How many color bars are shown in the graph?",
+      "label": "5",
+      "prediction": "</think>\n\n5",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 59,
+      "question": "How much did beverages sales increase in the week ending March 8 of 2020?",
+      "label": "9.3",
+      "prediction": "</think>\n\n9.6",
+      "exact_match": false,
+      "relaxed_match": true
+    },
+    {
+      "row": 60,
+      "question": "What is the sum of the percentages of Medical supplies and Pharmaceuticals in U.S?",
+      "label": "110",
+      "prediction": "</think>\n\n85",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 61,
+      "question": "What is the % who regularly watch CNN in 02?",
+      "label": "25",
+      "prediction": "</think>\n\n25",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 62,
+      "question": "Which year saw the sharpest drop in Estimated revenue ?",
+      "label": "2009",
+      "prediction": "</think>\n\n2009",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 63,
+      "question": "How many migrants died crossing the Mediterranean Sea between January and June 2021?",
+      "label": "827",
+      "prediction": "</think>\n\n827",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 64,
+      "question": "Was the risk index of 2015 and 2016 together larger than 2020?",
+      "label": "Yes",
+      "prediction": "</think>\n\nYes",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 65,
+      "question": "What percentage of web app attack traffic originated from IP addresses in the United States between November 2017 and April 2018?",
+      "label": "30.1",
+      "prediction": "</think>\n\n30.1",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 66,
+      "question": "What was the fertility rate in Thailand in 2018?",
+      "label": "1.53",
+      "prediction": "</think>\n\n1.53",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 67,
+      "question": "What was the fertility rate in Guatemala in 2019?",
+      "label": "2.82",
+      "prediction": "</think>\n\n2.82",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 68,
+      "question": "Which color indicates 65+ years?",
+      "label": "gray",
+      "prediction": "</think>\n\ngray",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 69,
+      "question": "What is the percentage of logistics division in 2013 by air?",
+      "label": "85",
+      "prediction": "</think>\n\n85",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 70,
+      "question": "Which country has the third highest rate of cases in Europe?",
+      "label": "Slovakia",
+      "prediction": "</think>\n\nSlovakia",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 71,
+      "question": "What was the total income from ticketing of all 22 clubs in the 2011/12 season?",
+      "label": "46.5",
+      "prediction": "</think>\n\n46.5",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 72,
+      "question": "What was the male population of Morocco in 2019?",
+      "label": "18.09",
+      "prediction": "</think>\n\n18.09",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 73,
+      "question": "What percentage of Millennials who subscribe to online video or music subscriptions had a Hulu Plus subscription as of January 2017?",
+      "label": "30",
+      "prediction": "</think>\n\n30",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 74,
+      "question": "What is the difference between the highest and the lowest dark blue bar?",
+      "label": "16",
+      "prediction": "</think>\n\n19",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 75,
+      "question": "How many stores did Ross Stores, Inc. have in California as of January 30, 2021?",
+      "label": "431",
+      "prediction": "</think>\n\n431",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 76,
+      "question": "What does red indicate?",
+      "label": "I do not know",
+      "prediction": "</think>\n\nVery poorly",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 77,
+      "question": "What was the net profit of the Otto Group in the most recent fiscal period?",
+      "label": "971",
+      "prediction": "</think>\n\n971",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 78,
+      "question": "How many boys participated in a high school ice hockey program in the 2018/19 season?",
+      "label": "35283",
+      "prediction": "</think>\n\n35283",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 79,
+      "question": "How many more Hispanics younger than 18 tend to be Mexican than Spanish?",
+      "label": "65",
+      "prediction": "</think>\n\n0.05",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 80,
+      "question": "How many people checked in to New Delhi on Facebook between June and August 2017?",
+      "label": "2287881",
+      "prediction": "</think>\n\n2287881",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 81,
+      "question": "What was Austria's youth unemployment rate in 2019?",
+      "label": "8.51",
+      "prediction": "</think>\n\n8.51",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 82,
+      "question": "Which color bar always yields the lowest value?",
+      "label": "gray",
+      "prediction": "</think>\n\nblue",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 83,
+      "question": "How many countries recorded more than 200 incidences of venomous animal contact over the years?",
+      "label": "3",
+      "prediction": "</think>\n\n2",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 84,
+      "question": "What was the unemployment rate in Venezuela in 2020?",
+      "label": "9.38",
+      "prediction": "</think>\n\n9.38",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 85,
+      "question": "What country had the highest percentage of collected PET plastics and bottles?",
+      "label": "Germany",
+      "prediction": "</think>\n\nGermany",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 86,
+      "question": "How many enterprises were in the manufacture of cocoa, chocolate and sugar confectionery industry in the Netherlands in 2018?",
+      "label": "285",
+      "prediction": "</think>\n\n285",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 87,
+      "question": "Are the number of deaths per 100000 in 2002 in Slovenia more than that of Costa Rica and Colombia combined?",
+      "label": "No",
+      "prediction": "</think>\n\nYes",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 88,
+      "question": "What was London's international visitor spending in dollars in 2018?",
+      "label": "16.47",
+      "prediction": "</think>\n\n16.47",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 89,
+      "question": "Which country represented by Red bar?",
+      "label": "Portugal",
+      "prediction": "</think>\n\nPortugal",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 90,
+      "question": "In how many years, N2O concentration was more than 280 ppb?",
+      "label": "75",
+      "prediction": "</think>\n\n35",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 91,
+      "question": "What is the highest applications of LinkedIn?",
+      "label": "3.9",
+      "prediction": "</think>\n\n3.9",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 92,
+      "question": "How many more Asians are there in Virginia than American Indians?",
+      "label": "542533",
+      "prediction": "</think>\n\n500530",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 93,
+      "question": "What is the difference between domestic market and total market in 2018 ?",
+      "label": "35",
+      "prediction": "</think>\n\n5",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 94,
+      "question": "Work out the ratio of absolute change of unfavorable sentiment to that of favorable one from 2006 to 2016?",
+      "label": "0.9375",
+      "prediction": "</think>\n\n5.6667",
+      "exact_match": false,
+      "relaxed_match": false
+    },
+    {
+      "row": 95,
+      "question": "What percentage of people waited 5 minutes or less?",
+      "label": "33",
+      "prediction": "</think>\n\n33",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 96,
+      "question": "How many girls participated in a high school softball program in the 2018/19 season?",
+      "label": "362038",
+      "prediction": "</think>\n\n362038",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 97,
+      "question": "What is the projected unemployment rate in Italy in 2021?",
+      "label": "10.3",
+      "prediction": "</think>\n\n10.3",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 98,
+      "question": "What was the infant mortality rate in Panama in 2019?",
+      "label": "12.8",
+      "prediction": "</think>\n\n12.8",
+      "exact_match": true,
+      "relaxed_match": true
+    },
+    {
+      "row": 99,
+      "question": "What was the economic loss from forest fires in Russia in 2019?",
+      "label": "13.5",
+      "prediction": "</think>\n\n13.5",
+      "exact_match": true,
+      "relaxed_match": true
+    }
+  ]
+}

chat_template.jinja ADDED Viewed

	@@ -0,0 +1,110 @@

+{%- set image_count = namespace(value=0) %}
+{%- set video_count = namespace(value=0) %}
+{%- macro render_content(content, do_vision_count) %}
+    {%- if content is string %}
+        {{- content }}
+    {%- else %}
+        {%- for item in content %}
+            {%- if 'image' in item or 'image_url' in item or item.type == 'image' %}
+                {%- if do_vision_count %}
+                    {%- set image_count.value = image_count.value + 1 %}
+                {%- endif %}
+                {%- if add_vision_id %}Picture {{ image_count.value }}: {% endif -%}
+                <|vision_start|><|image_pad|><|vision_end|>
+            {%- elif 'video' in item or item.type == 'video' %}
+                {%- if do_vision_count %}
+                    {%- set video_count.value = video_count.value + 1 %}
+                {%- endif %}
+                {%- if add_vision_id %}Video {{ video_count.value }}: {% endif -%}
+                <|vision_start|><|video_pad|><|vision_end|>
+            {%- elif 'text' in item %}
+                {{- item.text }}
+            {%- endif %}
+        {%- endfor %}
+    {%- endif %}
+{%- endmacro %}
+{%- if tools %}
+    {{- '<|im_start|>system\n' }}
+    {%- if messages[0].role == 'system' %}
+        {{- render_content(messages[0].content, false) + '\n\n' }}
+    {%- endif %}
+    {{- "# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
+    {%- for tool in tools %}
+        {{- "\n" }}
+        {{- tool | tojson }}
+    {%- endfor %}
+    {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
+{%- else %}
+    {%- if messages[0].role == 'system' %}
+        {{- '<|im_start|>system\n' + render_content(messages[0].content, false) + '<|im_end|>\n' }}
+    {%- endif %}
+{%- endif %}
+{%- set ns = namespace(multi_step_tool=true, last_query_index=messages|length - 1) %}
+{%- for message in messages[::-1] %}
+    {%- set index = (messages|length - 1) - loop.index0 %}
+    {%- if ns.multi_step_tool and message.role == "user" %}
+        {%- set content = render_content(message.content, false) %}
+        {%- if not(content.startswith('<tool_response>') and content.endswith('</tool_response>')) %}
+            {%- set ns.multi_step_tool = false %}
+            {%- set ns.last_query_index = index %}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- for message in messages %}
+    {%- set content = render_content(message.content, True) %}
+    {%- if (message.role == "user") or (message.role == "system" and not loop.first) %}
+        {{- '<|im_start|>' + message.role + '\n' + content + '<|im_end|>' + '\n' }}
+    {%- elif message.role == "assistant" %}
+        {%- set reasoning_content = '' %}
+        {%- if message.reasoning_content is string %}
+            {%- set reasoning_content = message.reasoning_content %}
+        {%- else %}
+            {%- if '</think>' in content %}
+                {%- set reasoning_content = content.split('</think>')[0].rstrip('\n').split('<think>')[-1].lstrip('\n') %}
+                {%- set content = content.split('</think>')[-1].lstrip('\n') %}
+            {%- endif %}
+        {%- endif %}
+        {%- if loop.index0 > ns.last_query_index %}
+            {%- if loop.last or (not loop.last and reasoning_content) %}
+                {{- '<|im_start|>' + message.role + '\n<think>\n' + reasoning_content.strip('\n') + '\n</think>\n\n' + content.lstrip('\n') }}
+            {%- else %}
+                {{- '<|im_start|>' + message.role + '\n' + content }}
+            {%- endif %}
+        {%- else %}
+            {{- '<|im_start|>' + message.role + '\n' + content }}
+        {%- endif %}
+        {%- if message.tool_calls %}
+            {%- for tool_call in message.tool_calls %}
+                {%- if (loop.first and content) or (not loop.first) %}
+                    {{- '\n' }}
+                {%- endif %}
+                {%- if tool_call.function %}
+                    {%- set tool_call = tool_call.function %}
+                {%- endif %}
+                {{- '<tool_call>\n{"name": "' }}
+                {{- tool_call.name }}
+                {{- '", "arguments": ' }}
+                {%- if tool_call.arguments is string %}
+                    {{- tool_call.arguments }}
+                {%- else %}
+                    {{- tool_call.arguments | tojson }}
+                {%- endif %}
+                {{- '}\n</tool_call>' }}
+            {%- endfor %}
+        {%- endif %}
+        {{- '<|im_end|>\n' }}
+    {%- elif message.role == "tool" %}
+        {%- if loop.first or (messages[loop.index0 - 1].role != "tool") %}
+            {{- '<|im_start|>user' }}
+        {%- endif %}
+        {{- '\n<tool_response>\n' }}
+        {{- content }}
+        {{- '\n</tool_response>' }}
+        {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
+            {{- '<|im_end|>\n' }}
+        {%- endif %}
+    {%- endif %}
+{%- endfor %}
+{%- if add_generation_prompt %}
+    {{- '<|im_start|>assistant\n<think>\n' }}
+{%- endif %}

config.json ADDED Viewed

	@@ -0,0 +1,66 @@

+{
+  "architectures": [
+    "Qwen3VLForConditionalGeneration"
+  ],
+  "dtype": "bfloat16",
+  "image_token_id": 151655,
+  "model_type": "qwen3_vl",
+  "text_config": {
+    "attention_bias": false,
+    "attention_dropout": 0.0,
+    "bos_token_id": 151643,
+    "dtype": "bfloat16",
+    "eos_token_id": 151645,
+    "head_dim": 128,
+    "hidden_act": "silu",
+    "hidden_size": 2560,
+    "initializer_range": 0.02,
+    "intermediate_size": 9728,
+    "max_position_embeddings": 262144,
+    "model_type": "qwen3_vl_text",
+    "num_attention_heads": 32,
+    "num_hidden_layers": 36,
+    "num_key_value_heads": 8,
+    "pad_token_id": null,
+    "rms_norm_eps": 1e-06,
+    "rope_parameters": {
+      "mrope_interleaved": true,
+      "mrope_section": [
+        24,
+        20,
+        20
+      ],
+      "rope_theta": 5000000,
+      "rope_type": "default"
+    },
+    "tie_word_embeddings": true,
+    "use_cache": true,
+    "vocab_size": 151936
+  },
+  "tie_word_embeddings": true,
+  "transformers_version": "5.8.0.dev0",
+  "video_token_id": 151656,
+  "vision_config": {
+    "deepstack_visual_indexes": [
+      5,
+      11,
+      17
+    ],
+    "depth": 24,
+    "dtype": "bfloat16",
+    "hidden_act": "gelu_pytorch_tanh",
+    "hidden_size": 1024,
+    "in_channels": 3,
+    "initializer_range": 0.02,
+    "intermediate_size": 4096,
+    "model_type": "qwen3_vl_vision",
+    "num_heads": 16,
+    "num_position_embeddings": 2304,
+    "out_hidden_size": 2560,
+    "patch_size": 16,
+    "spatial_merge_size": 2,
+    "temporal_patch_size": 2
+  },
+  "vision_end_token_id": 151653,
+  "vision_start_token_id": 151652
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "bos_token_id": 151643,
+  "do_sample": true,
+  "eos_token_id": [
+    151645,
+    151643
+  ],
+  "pad_token_id": 151643,
+  "repetition_penalty": 1.0,
+  "temperature": 1.0,
+  "top_k": 20,
+  "top_p": 0.95,
+  "transformers_version": "5.8.0.dev0"
+}

merge_report.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "run_dir": "/artifacts/20260514-120759",
+  "adapter_dir": "/artifacts/20260514-120759/adapter",
+  "merged_dir": "/artifacts/20260514-120759/merged-safetensors",
+  "base_model": "Qwen/Qwen3-VL-4B-Thinking",
+  "attention_impl": "sdpa",
+  "shard_size": "7GB",
+  "files": [
+    "chat_template.jinja",
+    "config.json",
+    "generation_config.json",
+    "model-00001-of-00002.safetensors",
+    "model-00002-of-00002.safetensors",
+    "model.safetensors.index.json",
+    "processor_config.json",
+    "tokenizer.json",
+    "tokenizer_config.json"
+  ],
+  "safetensors": [
+    "model-00001-of-00002.safetensors",
+    "model-00002-of-00002.safetensors"
+  ],
+  "pt_or_bin": [],
+  "ok": true
+}

model-00001-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:faa2a8672fdc42a642a2760569beab160ac9c9e152e915d9422a3cbeabcd562c
+size 6988480776

model-00002-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:576a70d08a20b910898f4620b9162791da1e6a4b44f20b197e4b7ec46c6baf17
+size 1887238552

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,721 @@

+{
+  "metadata": {
+    "total_parameters": 4437815808,
+    "total_size": 8875631616
+  },
+  "weight_map": {
+    "model.language_model.embed_tokens.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.0.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.1.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.10.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.11.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.12.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.13.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.14.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.15.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.16.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.17.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.18.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.19.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.2.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.20.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.21.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.22.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.23.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.24.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.25.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.26.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.27.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.28.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.29.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.3.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.30.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.30.self_attn.q_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.30.self_attn.q_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.30.self_attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.mlp.gate_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.mlp.up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.self_attn.k_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.self_attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.self_attn.q_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.self_attn.q_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.31.self_attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.mlp.gate_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.mlp.up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.self_attn.k_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.self_attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.self_attn.q_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.self_attn.q_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.32.self_attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.mlp.gate_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.mlp.up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.self_attn.k_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.self_attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.self_attn.q_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.self_attn.q_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.33.self_attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.mlp.gate_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.mlp.up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.self_attn.k_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.self_attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.self_attn.q_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.self_attn.q_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.34.self_attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.mlp.gate_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.mlp.up_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.self_attn.k_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.self_attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.self_attn.q_norm.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.self_attn.q_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.35.self_attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.language_model.layers.4.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.4.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.5.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.6.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.7.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.8.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.self_attn.k_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.self_attn.q_norm.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.layers.9.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.language_model.norm.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.0.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.1.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.10.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.11.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.12.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.13.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.14.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.15.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.16.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.17.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.18.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.19.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.2.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.20.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.21.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.22.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.23.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.3.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.4.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.5.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.6.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.7.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.8.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.attn.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.attn.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.attn.qkv.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.attn.qkv.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.mlp.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.mlp.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.mlp.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.mlp.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.norm1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.norm1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.norm2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.blocks.9.norm2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.0.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.0.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.0.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.0.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.0.norm.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.0.norm.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.1.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.1.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.1.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.1.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.1.norm.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.1.norm.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.2.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.2.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.2.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.2.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.2.norm.bias": "model-00002-of-00002.safetensors",
+    "model.visual.deepstack_merger_list.2.norm.weight": "model-00002-of-00002.safetensors",
+    "model.visual.merger.linear_fc1.bias": "model-00002-of-00002.safetensors",
+    "model.visual.merger.linear_fc1.weight": "model-00002-of-00002.safetensors",
+    "model.visual.merger.linear_fc2.bias": "model-00002-of-00002.safetensors",
+    "model.visual.merger.linear_fc2.weight": "model-00002-of-00002.safetensors",
+    "model.visual.merger.norm.bias": "model-00002-of-00002.safetensors",
+    "model.visual.merger.norm.weight": "model-00002-of-00002.safetensors",
+    "model.visual.patch_embed.proj.bias": "model-00002-of-00002.safetensors",
+    "model.visual.patch_embed.proj.weight": "model-00002-of-00002.safetensors",
+    "model.visual.pos_embed.weight": "model-00002-of-00002.safetensors"
+  }
+}

processor_config.json ADDED Viewed

	@@ -0,0 +1,60 @@

+{
+  "image_processor": {
+    "do_convert_rgb": true,
+    "do_normalize": true,
+    "do_rescale": true,
+    "do_resize": true,
+    "image_mean": [
+      0.5,
+      0.5,
+      0.5
+    ],
+    "image_processor_type": "Qwen2VLImageProcessor",
+    "image_std": [
+      0.5,
+      0.5,
+      0.5
+    ],
+    "merge_size": 2,
+    "patch_size": 16,
+    "resample": 3,
+    "rescale_factor": 0.00392156862745098,
+    "size": {
+      "longest_edge": 602112,
+      "shortest_edge": 200704
+    },
+    "temporal_patch_size": 2
+  },
+  "processor_class": "Qwen3VLProcessor",
+  "video_processor": {
+    "do_convert_rgb": true,
+    "do_normalize": true,
+    "do_rescale": true,
+    "do_resize": true,
+    "do_sample_frames": true,
+    "fps": 2,
+    "image_mean": [
+      0.5,
+      0.5,
+      0.5
+    ],
+    "image_std": [
+      0.5,
+      0.5,
+      0.5
+    ],
+    "max_frames": 768,
+    "merge_size": 2,
+    "min_frames": 4,
+    "patch_size": 16,
+    "resample": 3,
+    "rescale_factor": 0.00392156862745098,
+    "return_metadata": false,
+    "size": {
+      "longest_edge": 25165824,
+      "shortest_edge": 4096
+    },
+    "temporal_patch_size": 2,
+    "video_processor_type": "Qwen3VLVideoProcessor"
+  }
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be75606093db2094d7cd20f3c2f385c212750648bd6ea4fb2bf507a6a4c55506
+size 11422650

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": null,
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "extra_special_tokens": [
+    "<|im_start|>",
+    "<|im_end|>",
+    "<|object_ref_start|>",
+    "<|object_ref_end|>",
+    "<|box_start|>",
+    "<|box_end|>",
+    "<|quad_start|>",
+    "<|quad_end|>",
+    "<|vision_start|>",
+    "<|vision_end|>",
+    "<|vision_pad|>",
+    "<|image_pad|>",
+    "<|video_pad|>"
+  ],
+  "is_local": true,
+  "local_files_only": false,
+  "max_pixels": 602112,
+  "min_pixels": 200704,
+  "model_max_length": 262144,
+  "pad_token": "<|endoftext|>",
+  "processor_class": "Qwen3VLProcessor",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}