drzo
/

echoself

cognitive-architecture

Model card Files Files and versions

echoself / training_metadata.json

drzo's picture

Training update: run 333, 500 iters, cache_key=ci

bbf7b2b verified 4 minutes ago

history blame contribute delete

1.41 kB

	{
	"checkpoint_id": "ckpt_20260418_020417_3000_22deff1b_9470fbb7",
	"created_at": "2026-04-18T02:04:17.846624",
	"iteration": 3000,
	"epoch": 0,
	"train_loss": 0.0,
	"val_loss": 0.021940011512488127,
	"learning_rate": 8.397199999999999e-05,
	"model_config": {
	"n_layer": 4,
	"n_head": 4,
	"n_embd": 256,
	"vocab_size": 50257,
	"block_size": 1024,
	"dropout": 0.1,
	"bias": true,
	"initial_connections": 0.1,
	"connection_growth_rate": 0.05,
	"max_connections": 1.0
	},
	"training_config": {
	"learning_rate": 0.0002,
	"batch_size": 2,
	"max_iters": 500,
	"warmup_iters": 5000,
	"lr_decay_iters": 50000,
	"min_lr": 1e-05,
	"weight_decay": 0.1,
	"grad_clip": 1.0,
	"enable_curriculum_learning": true,
	"enable_introspection": true
	},
	"data_config": {
	"data_dir": "data/nanecho",
	"batch_size": 2,
	"block_size": 1024
	},
	"metrics": {
	"val_loss": 0.021940011512488127,
	"connection_ratio": 1.0,
	"tokens_processed": 6144000,
	"training_speed_iters_per_sec": 0.07948755731832967
	},
	"tags": [
	"phase_adaptive_mastery",
	"high_quality",
	"nanecho",
	"curriculum",
	"introspection"
	],
	"parent_checkpoint": null,
	"notes": "Training checkpoint at iteration 3000 (resumed from iteration 2500) \| Phase: adaptive_mastery",
	"file_size_mb": 250.30978298187256,
	"quality_score": 460800.7675787804
	}