initial model upload

Files changed (4) hide show

README.md CHANGED Viewed

@@ -1,3 +1,16 @@
----
-license: mit
----

+---
+pipeline_tag: text-generation
+tags:
+  - pytorch
+  - code-generation
+---
+# Custom GPT for Python Code Completion
+## Model Details
+- **Parameters:** 135.00M
+- **Architecture:** Transformer (12 layers, 12 heads, 768 embedding dimension)
+- **Context Length (Block Size):** 1024 tokens
+## Training Metrics
+- **Final Validation Loss:** `1.6620`

model_config.json ADDED Viewed

+{
+    "vocab_size": 32000,
+    "block_size": 1024,
+    "n_layer": 12,
+    "n_head": 12,
+    "n_embd": 768,
+    "dropout": 0.1
+}

model_weights.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb618b52349f7ac8449642d34efcbcb2a66b7b3c3aa4abbc7eaba2e56c4ce4f5
+size 1144053200

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff