Leon299 commited on 27 days ago

Commit

4b5d3f8

verified ·

1 Parent(s): 9bdba73

Upload folder using huggingface_hub

Browse files

Files changed (25) hide show

.gitattributes +10 -0
checkpoint-100000/config.json +23 -0
checkpoint-100000/model.safetensors +3 -0
checkpoint-100000/optimizer.pt +3 -0
checkpoint-100000/rng_state.pth +0 -0
checkpoint-100000/scheduler.pt +0 -0
checkpoint-100000/trainer_state.json +3 -0
checkpoint-100000/training_args.bin +0 -0
checkpoint-98000/config.json +23 -0
checkpoint-98000/model.safetensors +3 -0
checkpoint-98000/optimizer.pt +3 -0
checkpoint-98000/rng_state.pth +0 -0
checkpoint-98000/scheduler.pt +0 -0
checkpoint-98000/trainer_state.json +3 -0
checkpoint-98000/training_args.bin +0 -0
checkpoint-99000/config.json +23 -0
checkpoint-99000/model.safetensors +3 -0
checkpoint-99000/optimizer.pt +3 -0
checkpoint-99000/rng_state.pth +0 -0
checkpoint-99000/scheduler.pt +0 -0
checkpoint-99000/trainer_state.json +3 -0
checkpoint-99000/training_args.bin +0 -0
final/config.json +23 -0
final/model.safetensors +3 -0
final/training_args.bin +0 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,10 @@

+checkpoint-100000/model.safetensors filter=lfs diff=lfs merge=lfs -text
+checkpoint-100000/optimizer.pt filter=lfs diff=lfs merge=lfs -text
+checkpoint-100000/trainer_state.json filter=lfs diff=lfs merge=lfs -text
+checkpoint-98000/model.safetensors filter=lfs diff=lfs merge=lfs -text
+checkpoint-98000/optimizer.pt filter=lfs diff=lfs merge=lfs -text
+checkpoint-98000/trainer_state.json filter=lfs diff=lfs merge=lfs -text
+checkpoint-99000/model.safetensors filter=lfs diff=lfs merge=lfs -text
+checkpoint-99000/optimizer.pt filter=lfs diff=lfs merge=lfs -text
+checkpoint-99000/trainer_state.json filter=lfs diff=lfs merge=lfs -text
+final/model.safetensors filter=lfs diff=lfs merge=lfs -text

checkpoint-100000/config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "architectures": [
+    "TokenSeparator"
+  ],
+  "bos_token_id": 1024,
+  "codebook_decoder_layers": 4,
+  "codebook_size": 1024,
+  "d_model": 768,
+  "dim_feedforward": 3072,
+  "dropout": 0.1,
+  "dtype": "float32",
+  "latent_dim": 128,
+  "model_type": "token_separator",
+  "n_stems": 4,
+  "nhead": 8,
+  "num_layers": 8,
+  "predict_n_q": 16,
+  "rope_base": 10000.0,
+  "tie_codebook_embeddings": false,
+  "transformers_version": "5.2.0",
+  "use_cache": false,
+  "vocab_size": 1025
+}

checkpoint-100000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f53a7a99ddbd806ac277ba8f94e49e67b16e545f43dda58ddaad11ffdda64e7
+size 869663248

checkpoint-100000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3feb28baf2bbfebebd75757f9e1aa20e3c32ab1fa36f1cd31ab08bebf804d919
+size 1733303031

checkpoint-100000/rng_state.pth ADDED Viewed

Binary file (14.6 kB). View file

checkpoint-100000/scheduler.pt ADDED Viewed

Binary file (1.47 kB). View file

checkpoint-100000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:61e4e8d08fb6f597dda054ef941c758dc2b1ab148ce2a804bd97ac7aabb96bd3
+size 15930894

checkpoint-100000/training_args.bin ADDED Viewed

Binary file (5.2 kB). View file

checkpoint-98000/config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "architectures": [
+    "TokenSeparator"
+  ],
+  "bos_token_id": 1024,
+  "codebook_decoder_layers": 4,
+  "codebook_size": 1024,
+  "d_model": 768,
+  "dim_feedforward": 3072,
+  "dropout": 0.1,
+  "dtype": "float32",
+  "latent_dim": 128,
+  "model_type": "token_separator",
+  "n_stems": 4,
+  "nhead": 8,
+  "num_layers": 8,
+  "predict_n_q": 16,
+  "rope_base": 10000.0,
+  "tie_codebook_embeddings": false,
+  "transformers_version": "5.2.0",
+  "use_cache": false,
+  "vocab_size": 1025
+}

checkpoint-98000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:51626cc6522617ae017fa3e515db83050accaa3436b260fecba2fc6b1e7773aa
+size 869663248

checkpoint-98000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90de66e8cb2c29eb5246a2fac131f41fac7a809d1263817d010d28f22bb82c01
+size 1733303031

checkpoint-98000/rng_state.pth ADDED Viewed

Binary file (14.6 kB). View file

checkpoint-98000/scheduler.pt ADDED Viewed

Binary file (1.47 kB). View file

checkpoint-98000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a9687d57682b34f76589421cc3601b01b9992c2e4d6800a62b6bc25312c13c2
+size 15612171

checkpoint-98000/training_args.bin ADDED Viewed

Binary file (5.2 kB). View file

checkpoint-99000/config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "architectures": [
+    "TokenSeparator"
+  ],
+  "bos_token_id": 1024,
+  "codebook_decoder_layers": 4,
+  "codebook_size": 1024,
+  "d_model": 768,
+  "dim_feedforward": 3072,
+  "dropout": 0.1,
+  "dtype": "float32",
+  "latent_dim": 128,
+  "model_type": "token_separator",
+  "n_stems": 4,
+  "nhead": 8,
+  "num_layers": 8,
+  "predict_n_q": 16,
+  "rope_base": 10000.0,
+  "tie_codebook_embeddings": false,
+  "transformers_version": "5.2.0",
+  "use_cache": false,
+  "vocab_size": 1025
+}

checkpoint-99000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2f7ea9608a59c39021b2675e1295dd596eb9d31550d66024aebfc24eae2acfb6
+size 869663248

checkpoint-99000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43f8d3f3f2635fec669291d742d169d27359fdf2bc41c932974db1bb28f55259
+size 1733303031

checkpoint-99000/rng_state.pth ADDED Viewed

Binary file (14.6 kB). View file

checkpoint-99000/scheduler.pt ADDED Viewed

Binary file (1.47 kB). View file

checkpoint-99000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8b8c251c0a822ef1a2cb6c2b0780b766700409656adbdff4bf1a7388eeb0375e
+size 15771582

checkpoint-99000/training_args.bin ADDED Viewed

Binary file (5.2 kB). View file

final/config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "architectures": [
+    "TokenSeparator"
+  ],
+  "bos_token_id": 1024,
+  "codebook_decoder_layers": 4,
+  "codebook_size": 1024,
+  "d_model": 768,
+  "dim_feedforward": 3072,
+  "dropout": 0.1,
+  "dtype": "float32",
+  "latent_dim": 128,
+  "model_type": "token_separator",
+  "n_stems": 4,
+  "nhead": 8,
+  "num_layers": 8,
+  "predict_n_q": 16,
+  "rope_base": 10000.0,
+  "tie_codebook_embeddings": false,
+  "transformers_version": "5.2.0",
+  "use_cache": false,
+  "vocab_size": 1025
+}

final/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f53a7a99ddbd806ac277ba8f94e49e67b16e545f43dda58ddaad11ffdda64e7
+size 869663248

final/training_args.bin ADDED Viewed

Binary file (5.2 kB). View file