örnek eğitim scripti
#1
by NovaYear - opened
merhaba, mümkünse kullanmış olduğunuz fine-tune scriptini paylaşırmısınız, bu konuda merakı olanlar kendini geliştirmek isteyenler için eğitim amaçlı bir kaynak olur. tşkler.
Kardeşim merhabalar, geç geri dönüşüm için üzgünüm bir takım işlerim vardı. Fine-Tuning için kullanmış olduğum script:
import torch
from datasets import load_dataset
from unsloth import FastLanguageModel
from transformers import TrainingArguments
from trl import SFTTrainer
print("PyTorch CUDA'yı görüyor mu? -> ", torch.cuda.is_available())
model_name = "vngrs-ai/Kumru-2B-v0.2.1"
max_seq_length = 2048
print("Model ve tokenizer (4-bit QLoRA) yükleniyor...")
model, tokenizer = FastLanguageModel.from_pretrained(
model_name = model_name,
max_seq_length = max_seq_length,
dtype = torch.bfloat16,
load_in_4bit = True,
)
print("Model ve tokenizer yüklendi.")
model = FastLanguageModel.get_peft_model(
model,
r = 16,
target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
"gate_proj", "up_proj", "down_proj",],
lora_alpha = 16,
lora_dropout = 0,
bias = "none",
use_gradient_checkpointing = True,
random_state = 3407,
)
dataset_name = "hamuz/UltraChatTR_50k"
print(f"'{dataset_name}' veri seti indiriliyor...")
data = load_dataset(dataset_name, split="train")
print("Veri seti indirildi.")
training_args = TrainingArguments(
output_dir = "./kumru-2b-lora-1xh100",
per_device_train_batch_size = 24,
gradient_accumulation_steps = 4,
warmup_steps = 100,
num_train_epochs = 1,
learning_rate = 2e-4,
bf16 = True,
logging_steps = 5,
save_steps = 50,
optim = "adamw_8bit",
lr_scheduler_type = "cosine",
seed = 3407,
)
trainer = SFTTrainer(
model = model,
tokenizer = tokenizer,
train_dataset = data,
dataset_text_field = "text",
max_seq_length = max_seq_length,
args = training_args,
)
print("LoRA eğitimi başlıyor...")
trainer.train()
print("Eğitim tamamlandı!")
final_model_path = "./kumru-2b-lora-final-1xh100"
trainer.save_model(final_model_path)
print(f"Eğitilen LoRA adaptörleri şuraya kaydedildi: {final_model_path}")
hamuz changed discussion status to closed