SykoSLM
/

SykoLLM-V5.8-Mini

Text Generation

text-generation-inference

Model card Files Files and versions

SykoSLM commited on 10 days ago

Commit

0f3e78a

·

verified ·

1 Parent(s): 963c657

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -42,9 +42,9 @@ library_name: transformers
 | Vocabulary Boyutu | 50.000 |
 | Maksimum Bağlam | 1024 Token |
 | Aktivasyon Fonksiyonu | SiLU |
-| Eğitim Adımı | ~3.400 Step |
 | Yaklaşık Eğitim Örneği | ~1.000.000+ |
-| Yaklaşık Eğitim Token'ı | ~1.500.000.000+ |
 | Eğitim Donanımı | 2x NVIDIA Tesla T4 |
 ---
@@ -85,7 +85,7 @@ Model, sıfırdan eğitilmiş özel bir BPE tokenizer kullanmaktadır. Hugging F
 | Warmup Steps | 200 |
 | Batch Size | 8 per device x 2 GPU |
 | Gradient Accumulation | 8 (Efektif batch: 128) |
-| Max Steps | 3.400 |
 | Precision | FP16 |
 | Max Grad Norm | 1.0 |
 | Weight Decay | 0.05 |

 | Vocabulary Boyutu | 50.000 |
 | Maksimum Bağlam | 1024 Token |
 | Aktivasyon Fonksiyonu | SiLU |
+| Eğitim Adımı | ~3.500 Step |
 | Yaklaşık Eğitim Örneği | ~1.000.000+ |
+| Yaklaşık Eğitim Token'ı | ~1.000.000.000+ |
 | Eğitim Donanımı | 2x NVIDIA Tesla T4 |
 ---
 | Warmup Steps | 200 |
 | Batch Size | 8 per device x 2 GPU |
 | Gradient Accumulation | 8 (Efektif batch: 128) |
+| Max Steps | 3.500 |
 | Precision | FP16 |
 | Max Grad Norm | 1.0 |
 | Weight Decay | 0.05 |