YAML Metadata Warning:empty or missing yaml metadata in repo card

Check out the documentation for more information.

Qwen3-4B SFT v9 Clean Direct

概要

  • ベースモデル: Qwen/Qwen3-4B-Instruct-2507
  • データセット: merged_dataset_final_clean.jsonl (1500 samples)
  • 戦略: CoT除去済みクリーンデータ直接使用

設定

  • LoRA r: 64
  • LoRA alpha: 64
  • Learning rate: 5e-05
  • Epochs: 2
  • Batch size: 8
  • Max seq length: 1024

特徴

  • Person Y のデータクリーニングパイプラインで処理
  • CoT(Approach/Output)完全削除
  • 構文検証済みデータのみ使用
  • Empty Think Injection なし

フォーマット分布

  • csv: 300
  • json: 300
  • toml: 300
  • xml: 300
  • yaml: 300
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support