örnek eğitim scripti

#1
by NovaYear - opened

merhaba, mümkünse kullanmış olduğunuz fine-tune scriptini paylaşırmısınız, bu konuda merakı olanlar kendini geliştirmek isteyenler için eğitim amaçlı bir kaynak olur. tşkler.

Kardeşim merhabalar, geç geri dönüşüm için üzgünüm bir takım işlerim vardı. Fine-Tuning için kullanmış olduğum script:

import torch
from datasets import load_dataset
from unsloth import FastLanguageModel
from transformers import TrainingArguments
from trl import SFTTrainer

print("PyTorch CUDA'yı görüyor mu? -> ", torch.cuda.is_available())



model_name = "vngrs-ai/Kumru-2B-v0.2.1"
max_seq_length = 2048

print("Model ve tokenizer (4-bit QLoRA) yükleniyor...")
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = model_name,
    max_seq_length = max_seq_length,
    dtype = torch.bfloat16,
    load_in_4bit = True,
)
print("Model ve tokenizer yüklendi.")



model = FastLanguageModel.get_peft_model(
    model,
    r = 16,
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj",],

    lora_alpha = 16,

    lora_dropout = 0,
    bias = "none",  
    use_gradient_checkpointing = True,
    random_state = 3407,
)


dataset_name = "hamuz/UltraChatTR_50k"
print(f"'{dataset_name}' veri seti indiriliyor...")
data = load_dataset(dataset_name, split="train")
print("Veri seti indirildi.")


training_args = TrainingArguments(
    output_dir = "./kumru-2b-lora-1xh100",
    per_device_train_batch_size = 24,
    gradient_accumulation_steps = 4,
    warmup_steps = 100,
    num_train_epochs = 1,
    learning_rate = 2e-4,
    bf16 = True,
    logging_steps = 5,
    save_steps = 50,
    optim = "adamw_8bit",
    lr_scheduler_type = "cosine",
    seed = 3407,
)


trainer = SFTTrainer(
    model = model,
    tokenizer = tokenizer,
    train_dataset = data,
    dataset_text_field = "text",
    max_seq_length = max_seq_length,
    args = training_args,
)


print("LoRA eğitimi başlıyor...")
trainer.train()
print("Eğitim tamamlandı!")

final_model_path = "./kumru-2b-lora-final-1xh100"
trainer.save_model(final_model_path)
print(f"Eğitilen LoRA adaptörleri şuraya kaydedildi: {final_model_path}")
hamuz changed discussion status to closed

Sign up or log in to comment