ArinUmut
/

pan-turkic-tokenizer

Model card Files Files and versions

ArinUmut commited on 18 days ago

Commit

c349e58

·

verified ·

1 Parent(s): 9ab9039

Add tokenizer_config.json

Files changed (1) hide show

tokenizer_config.json +9 -0

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "tokenizer_class": "LlamaTokenizer",
+  "add_bos_token": false,
+  "add_eos_token": false,
+  "bos_token": "<bos>",
+  "eos_token": "<eos>",
+  "unk_token": "<unk>",
+  "pad_token": "<pad>"
+}