Kevew
/

hrm_test

Model card Files Files and versions

hrm_test / all_config.yaml

Kevew's picture

Upload folder using huggingface_hub

43f75e0 verified 7 months ago

history blame contribute delete

802 Bytes

	arch:
	H_cycles: 2
	H_layers: 4
	L_cycles: 2
	L_layers: 4
	expansion: 4
	halt_exploration_prob: 0.1
	halt_max_steps: 16
	hidden_size: 512
	loss:
	loss_type: stablemax_cross_entropy
	name: losses@ACTLossHead
	name: hrm.hrm_act_v1@HierarchicalReasoningModel_ACTV1
	num_heads: 8
	pos_encodings: rope
	puzzle_emb_ndim: 512
	beta1: 0.9
	beta2: 0.95
	checkpoint_every_eval: true
	checkpoint_path: checkpoints/Have-data ACT-torch/HierarchicalReasoningModel_ACTV1
	hasty-perch
	data_path: data/have-data
	epochs: 1
	eval_interval: 1
	eval_save_outputs: []
	global_batch_size: 250
	lr: 7.0e-05
	lr_min_ratio: 1.0
	lr_warmup_steps: 2000
	project_name: Have-data ACT-torch
	puzzle_emb_lr: 7.0e-05
	puzzle_emb_weight_decay: 1.0
	run_name: HierarchicalReasoningModel_ACTV1 hasty-perch
	seed: 0
	weight_decay: 1.0