ethanjtang
/

KinGPT

@@ -22,27 +22,27 @@ datasets:
 **arXiv link COMING SOON** <br>
-[![GitHub](https://img.shields.io/badge/GitHub-KINGPT-black.svg?style=for-the-badge)](https://github.com/ethanjtang/KINGPT) <br>
 [![HuggingFace](https://img.shields.io/badge/🤗_HuggingFace-Puzzles-yellow?style=for-the-badge)](https://huggingface.co/datasets/ethanjtang/GAMBIT-lichess-puzzle-positions) <br>
 [![HuggingFace](https://img.shields.io/badge/🤗_HuggingFace-SF18%20Selfplay-yellow?style=for-the-badge)](https://huggingface.co/datasets/ethanjtang/GAMBIT-stockfish18-selfplay) <br>
 ## Variants
-### KINGPT-Woodpecker
-KINGPT variant trained on 13,341,057 unique puzzle positions (FEN + best move pairs).
 Achieved `train loss 0.3590, val loss 0.3704` on puzzles corpus after training for ~500B tokens.
-### KINGPT-Beaver
-KINGPT variant trained on 54,681 unique positions generated from 1050 Stockfish 18 self-play games.
 Achieved `train loss 0.0974, val loss 1.7554` (overfitting due to small dataset size) on selfplay corpus after training for ~25B tokens.
-### KINGPT-Chimera
-KINGPT variant trained on combined dataset of 13,395,738 Woodpecker and Beaver variant positions.
 Achieved `train loss 0.3594, val loss 0.3710` on combined corpus after training for ~500B tokens.

 **arXiv link COMING SOON** <br>
+[![GitHub](https://img.shields.io/badge/GitHub-KinGPT-black.svg?style=for-the-badge)](https://github.com/ethanjtang/KinGPT) <br>
 [![HuggingFace](https://img.shields.io/badge/🤗_HuggingFace-Puzzles-yellow?style=for-the-badge)](https://huggingface.co/datasets/ethanjtang/GAMBIT-lichess-puzzle-positions) <br>
 [![HuggingFace](https://img.shields.io/badge/🤗_HuggingFace-SF18%20Selfplay-yellow?style=for-the-badge)](https://huggingface.co/datasets/ethanjtang/GAMBIT-stockfish18-selfplay) <br>
 ## Variants
+### KinGPT-Woodpecker
+KinGPT variant trained on 13,341,057 unique puzzle positions (FEN + best move pairs).
 Achieved `train loss 0.3590, val loss 0.3704` on puzzles corpus after training for ~500B tokens.
+### KinGPT-Beaver
+KinGPT variant trained on 54,681 unique positions generated from 1050 Stockfish 18 self-play games.
 Achieved `train loss 0.0974, val loss 1.7554` (overfitting due to small dataset size) on selfplay corpus after training for ~25B tokens.
+### KinGPT-Chimera
+KinGPT variant trained on combined dataset of 13,395,738 Woodpecker and Beaver variant positions.
 Achieved `train loss 0.3594, val loss 0.3710` on combined corpus after training for ~500B tokens.