Spaces:

trigger166
/

gradio-test

Runtime error

trigger166 commited on Nov 3, 2024

Commit

91b6ce1

1 Parent(s): 36c6aa0

train llama2

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ login(hf_token)
 dataset = load_dataset("json", data_files="data.jsonl")
 # Definisci il modello e il tokenizer
-model_name = "google/flan-t5-small" # Puoi scegliere un modello T5 base per semplicità
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
@@ -35,7 +35,7 @@ tokenized_dataset = dataset.map(preprocess_data, batched=True)
 # Configura i parametri di addestramento
 training_args = TrainingArguments(
     output_dir="./results",
-    eval_strategy="no",  # Disabilita la valutazione durante l'addestramento
     learning_rate=2e-5,
     per_device_train_batch_size=4,
     num_train_epochs=3,

 dataset = load_dataset("json", data_files="data.jsonl")
 # Definisci il modello e il tokenizer
+model_name = "meta-llama/Llama-2-7b-hf"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 # Configura i parametri di addestramento
 training_args = TrainingArguments(
     output_dir="./results",
+    eval_strategy="no", # Disabilita la valutazione durante l'addestramento
     learning_rate=2e-5,
     per_device_train_batch_size=4,
     num_train_epochs=3,