Harley-ml
/

Dillion-1.2M

Text Generation

Model card Files Files and versions

Harley-ml commited on 1 day ago

Commit

7f2e698

·

verified ·

1 Parent(s): 26dcbd4

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -108,10 +108,10 @@ We trained Dillion for 0.71 epochs on 14B (only saw ~9B) tokens of FineWeb-edu o
 | Task     | Metric          |  Dillion | SupraMini-v4-2M |  Tenete-8M |
 | -------- | --------------- | -------: | --------------: | ---------: |
-| ARC Easy | acc_norm        |   31.36% |               — |     0.3194 |
 | BLiMP    | acc             |   62.94% |          60.70% |          — |
-| PiQA     | acc_norm        |   53.10% |          51.90% |     0.5571 |
-| SWAG     | acc_norm        |   30.36% |               — |     0.3297 |
 | WikiText | bits_per_byte   |   1.6161 |               — |          — |
 | WikiText | byte_perplexity |   3.0655 |          3.1652 |          — |

 | Task     | Metric          |  Dillion | SupraMini-v4-2M |  Tenete-8M |
 | -------- | --------------- | -------: | --------------: | ---------: |
+| ARC Easy | acc_norm        |   31.36% |               — |     31.94% |
 | BLiMP    | acc             |   62.94% |          60.70% |          — |
+| PiQA     | acc_norm        |   53.10% |          51.90% |     55.71% |
+| SWAG     | acc_norm        |   30.36% |               — |     32.97% |
 | WikiText | bits_per_byte   |   1.6161 |               — |          — |
 | WikiText | byte_perplexity |   3.0655 |          3.1652 |          — |