dnnsdunca
/

Ddroidlabs-Codex-mini

Text Generation

Model card Files Files and versions

Ddroidlabs-Codex-mini / fine-tune-model.py

dnnsdunca's picture

Upload 19 files

1f6a5b9 verified almost 2 years ago

history blame contribute delete

923 Bytes

	# fine_tune_model.py
	from datasets import load_dataset
	from transformers import Trainer, TrainingArguments

	def fine_tune_model(model, tokenizer, dataset_path):
	dataset = load_dataset('json', data_files=dataset_path)

	def preprocess_function(examples):
	return tokenizer(examples['input'], truncation=True, padding=True)

	tokenized_datasets = dataset.map(preprocess_function, batched=True)

	training_args = TrainingArguments(
	output_dir="./results",
	evaluation_strategy="epoch",
	learning_rate=2e-5,
	per_device_train_batch_size=8,
	per_device_eval_batch_size=8,
	num_train_epochs=3,
	weight_decay=0.01,
	)

	trainer = Trainer(
	model=model,
	args=training_args,
	train_dataset=tokenized_datasets['train'],
	eval_dataset=tokenized_datasets['validation']
	)

	trainer.train()