ABerlanga
/

code-llama-7b-text-to-sql

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

ABerlanga commited on Mar 1, 2024

Commit

f3e1757

·

verified ·

1 Parent(s): 25ed65e

Model save

Files changed (1) hide show

README.md +8 -7

README.md CHANGED Viewed

@@ -1,12 +1,13 @@
 ---
 library_name: peft
 tags:
 - trl
 - sft
 - generated_from_trainer
 datasets:
 - generator
-base_model: meta-llama/Llama-2-7b-hf
 model-index:
 - name: code-llama-7b-text-to-sql
   results: []
@@ -17,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
 # code-llama-7b-text-to-sql
-This model is a fine-tuned version of [meta-llama/Llama-2-7b-hf](https://huggingface.co/meta-llama/Llama-2-7b-hf) on the generator dataset.
 ## Model description
@@ -37,11 +38,11 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 2
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
@@ -53,8 +54,8 @@ The following hyperparameters were used during training:
 ### Framework versions
-- PEFT 0.7.2.dev0
 - Transformers 4.36.2
-- Pytorch 2.2.0a0+81ea7a4
 - Datasets 2.16.1
-- Tokenizers 0.15.1

 ---
+license: llama2
 library_name: peft
 tags:
 - trl
 - sft
 - generated_from_trainer
+base_model: codellama/CodeLlama-7b-hf
 datasets:
 - generator
 model-index:
 - name: code-llama-7b-text-to-sql
   results: []
 # code-llama-7b-text-to-sql
+This model is a fine-tuned version of [codellama/CodeLlama-7b-hf](https://huggingface.co/codellama/CodeLlama-7b-hf) on the generator dataset.
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 3
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 6
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
 ### Framework versions
+- PEFT 0.9.1.dev0
 - Transformers 4.36.2
+- Pytorch 2.1.2+cu121
 - Datasets 2.16.1
+- Tokenizers 0.15.2