nraptisss
/

intent-translation-training

nraptisss commited on 12 days ago

Commit

f5ecafd

verified ·

1 Parent(s): 630af96

Fix: --max_seq_length → --max_length (matches train.py argparse)

Files changed (1) hide show

run.sh CHANGED Viewed

@@ -2,7 +2,7 @@
 # ============================================================
 # TMF921 Intent Translation Training — One-Command Runner
 # ============================================================
-# Run on a machine with an NVIDIA GPU (tested on RTX 6000 Ada 50GB)
 #
 # Usage:
 #   git clone https://huggingface.co/nraptisss/intent-translation-training
@@ -25,7 +25,7 @@ EPOCHS=3
 LR=1e-4
 BATCH_SIZE=4
 GRAD_ACCUM=8
-MAX_SEQ_LEN=4096
 LORA_R=32
 LORA_ALPHA=64
@@ -69,7 +69,7 @@ if [ "${1:-}" != "--eval-only" ]; then
         --lr $LR \
         --batch_size $BATCH_SIZE \
         --grad_accum $GRAD_ACCUM \
-        --max_seq_length $MAX_SEQ_LEN \
         --lora_r $LORA_R \
         --lora_alpha $LORA_ALPHA \
         ${HUB_MODEL_ID:+--push_to_hub --hub_model_id "$HUB_MODEL_ID"}

 # ============================================================
 # TMF921 Intent Translation Training — One-Command Runner
 # ============================================================
+# Run on a machine with an NVIDIA GPU (tested on RTX 6000 Ada 48GB)
 #
 # Usage:
 #   git clone https://huggingface.co/nraptisss/intent-translation-training
 LR=1e-4
 BATCH_SIZE=4
 GRAD_ACCUM=8
+MAX_LENGTH=4096
 LORA_R=32
 LORA_ALPHA=64
         --lr $LR \
         --batch_size $BATCH_SIZE \
         --grad_accum $GRAD_ACCUM \
+        --max_length $MAX_LENGTH \
         --lora_r $LORA_R \
         --lora_alpha $LORA_ALPHA \
         ${HUB_MODEL_ID:+--push_to_hub --hub_model_id "$HUB_MODEL_ID"}