qwen3-4b-sft-merged-0776v1

モデル概要

Qwen/Qwen3-4B-Instruct-2507 をベースに構造化データ出力（JSON / YAML / TOML / XML / CSV）タスクに特化してSFTファインチューニングを行い、LoRAアダプタをベースモデルとマージした16bitモデルです。

OmniCampus 2025 最終課題メインコンペ向けに作成しました。

このモデルはDPO（Direct Preference Optimization）のベースモデルとして使用することを想定しています。

Safetensors

Model size

4B params

Tensor type

BF16