jie530 commited on 10 days ago

Commit

eb608f5

verified ·

1 Parent(s): fb2b312

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +6 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/argv.txt +37 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/ema_net.pth +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/model.safetensors +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/optimizer.bin +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_0.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_1.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_2.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_3.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/scheduler.bin +3 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/envs.txt +17 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/run_config.json +300 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/debug-internal.log +0 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/debug.log +25 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/config.yaml +436 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/output.log +224 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/requirements.txt +205 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/wandb-metadata.json +129 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/wandb-summary.json +1 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug-internal.log +0 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug.log +25 -0
dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/run-q4pxxlgy.wandb +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/argv.txt +37 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/ema_net.pth +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/model.safetensors +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/optimizer.bin +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_0.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_1.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_2.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_3.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/scheduler.bin +3 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/envs.txt +17 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/run_config.json +300 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/debug-internal.log +0 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/debug.log +25 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/config.yaml +436 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/output.log +230 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/requirements.txt +205 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/wandb-metadata.json +129 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/wandb-summary.json +1 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug-core.log +19 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug-internal.log +0 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug.log +25 -0
dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/run-sjem5sh4.wandb +3 -0
dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/argv.txt +37 -0
dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/ema_net.pth +3 -0
dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/model.safetensors +3 -0
dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/optimizer.bin +3 -0
dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/random_states_0.pkl +3 -0
dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/random_states_1.pkl +3 -0

.gitattributes CHANGED Viewed

@@ -2106,3 +2106,9 @@ act/act-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-
 act/act-g1-sim/g1wholebodytabletopgrasp-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603190700/wandb/run-20260319_070047-kgnkklsw/run-kgnkklsw.wandb filter=lfs diff=lfs merge=lfs -text
 act/act-g1-sim/g1wholebodyxmovebendpickteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604091356/wandb/run-20260409_135628-skni4cjp/run-skni4cjp.wandb filter=lfs diff=lfs merge=lfs -text
 act/act-g1-sim/g1wholebodyxmovepick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604040237/wandb/run-20260404_023728-qq4fojro/run-qq4fojro.wandb filter=lfs diff=lfs merge=lfs -text

 act/act-g1-sim/g1wholebodytabletopgrasp-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603190700/wandb/run-20260319_070047-kgnkklsw/run-kgnkklsw.wandb filter=lfs diff=lfs merge=lfs -text
 act/act-g1-sim/g1wholebodyxmovebendpickteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604091356/wandb/run-20260409_135628-skni4cjp/run-skni4cjp.wandb filter=lfs diff=lfs merge=lfs -text
 act/act-g1-sim/g1wholebodyxmovepick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604040237/wandb/run-20260404_023728-qq4fojro/run-qq4fojro.wandb filter=lfs diff=lfs merge=lfs -text
+dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/run-q4pxxlgy.wandb filter=lfs diff=lfs merge=lfs -text
+dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/run-sjem5sh4.wandb filter=lfs diff=lfs merge=lfs -text
+dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/wandb/run-20260408_155038-072o1sgn/run-072o1sgn.wandb filter=lfs diff=lfs merge=lfs -text
+dp/diffusion-policy-g1-sim/g1wholebodytabletopgrasp-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603190701/wandb/run-20260319_070107-xj1s7wqu/run-xj1s7wqu.wandb filter=lfs diff=lfs merge=lfs -text
+dp/diffusion-policy-g1-sim/g1wholebodyxmovebendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604020758/wandb/run-20260402_075844-zpz3nbw9/run-zpz3nbw9.wandb filter=lfs diff=lfs merge=lfs -text
+dp/diffusion-policy-g1-sim/g1wholebodyxmovepick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604040957/wandb/run-20260404_095754-ei6sek0s/run-ei6sek0s.wandb filter=lfs diff=lfs merge=lfs -text

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/argv.txt ADDED Viewed

	@@ -0,0 +1,37 @@

+scripts/train.py
+simple_dp_config
+--seed=2026
+--exp=g1wholebodybendpick-v0
+--train.name=diffusion-policy-g1
+--log.report-to=wandb
+--train.data_parallel=ddp
+--train.mixed_precision=bf16
+--train.train-batch-size=32
+--train.warmup-steps=1000
+--train.warmup-ratio=None
+--train.checkpointing-steps=5000
+--train.validation_steps=500
+--train.val_num_batches=20
+--train.gradient_accumulation_steps=1
+--train.max-training-steps=40000
+--train.learning-rate=1e-4
+--train.max-grad-norm=1.0
+--train.lr_scheduler_kwargs.weight_decay=1e-6
+--train.lr_scheduler_kwargs.betas 0.95 0.999
+--train.lr_scheduler_type=cosine
+--data.root_dir=/data/jliu/data
+--data.train-repo-ids=G1WholebodyBendPick-v0
+--data.transform.repack.action_chunk_size=16
+--data.transform.repack.pad-action-dim=36
+--data.transform.repack.pad-state-dim=36
+--data.transform.field.stat-path=meta/stats_psi0.json
+--data.transform.field.stat-action-key=action
+--data.transform.field.stat-state-key=states
+--data.transform.field.normalize-state
+--data.transform.field.action-norm-type=bounds
+--data.transform.field.pad-action-dim=36
+--data.transform.field.pad-state-dim=36
+--data.transform.model.img-aug
+--model.action-chunk-size=16
+--model.action-dim=36
+--model.obs-dim=36

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/ema_net.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d8c4727a1ec7c89a0f0820a0f468b9b1d58f93a71ce3f35cf1ec667030f06d4
+size 337302879

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c55c264b9f098847a7d1b86f93c4ca548105d5f164df7e7897528b882572b264
+size 337238328

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/optimizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10ec543c4a0c00c14e86eb72965ea25f3b1fa217ba8601cbe1bc6f410606fa05
+size 674602251

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_0.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:faf49f02df00df10b1ca449b17a5d7c25fab7cf942cab6edc6724e07bc59630e
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_1.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ee0d940b68d363b86689ce83b318a89f6f1b260c687312fcd2dfbf60616727b
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_2.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ec7310301652e67dc740290e1c03e472c6851bc8553321fa426c5dec4d2f0a35
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/random_states_3.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1caa7eab048227d902a2778748c4f035dcca5f9902327bc5b7eab7cebc0e0645
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000/scheduler.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3ee6860bb6aecdd232f5d24bba08e626d7d56119a5f05ba8c2ad8eecf56fe38
+size 1465

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/envs.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+OMP_NUM_THREADS=32
+HF_HOME=/data/cache
+TORCH_HOME=/data/cache
+HF_TOKEN=hf_...TiKa
+HF_LEROBOT_HOME=/data/data/lerobot
+WE_HOME=Not Set
+DATA_HOME=/data/data
+UV_CACHE_DIR=/data/cache
+WANDB_API_KEY=90e...5c06
+PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python
+CUDA_VISIBLE_DEVICES=0,1,2,3
+WORLD_SIZE=4
+LOCAL_WORLD_SIZE=4
+RANK=0
+LOCAL_RANK=0
+MASTER_ADDR=nebula99
+MASTER_PORT=41289

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/run_config.json ADDED Viewed

	@@ -0,0 +1,300 @@

+{
+    "exp": "g1wholebodybendpick-v0",
+    "seed": 2026,
+    "auto_tag_run": false,
+    "eval": false,
+    "debug": false,
+    "timestamp": "2603181426",
+    "log": {
+        "logging_dir": "logs",
+        "report_to": "wandb",
+        "log_freq": 100
+    },
+    "wandb": {
+        "project": "psi",
+        "entity": "jliu530-soochow-university",
+        "group": "diffusion-policy-g1",
+        "id": "q4pxxlgy",
+        "name": "g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426",
+        "resume": "allow"
+    },
+    "train": {
+        "num_workers": 8,
+        "overfit_single_batch": false,
+        "name": "diffusion-policy-g1",
+        "resume_from_checkpoint": null,
+        "skip_resumed_steps": false,
+        "hf_token": ".hf_token",
+        "lora": false,
+        "output_dir": ".runs",
+        "gradient_accumulation_steps": 1,
+        "mixed_precision": "bf16",
+        "max_grad_norm": 1.0,
+        "optimizer_foreach": null,
+        "train_batch_size": 32,
+        "val_batch_size": 16,
+        "val_num_batches": 20,
+        "checkpointing_steps": 5000,
+        "max_checkpoints_to_keep": null,
+        "validation_steps": 500,
+        "learning_rate": 0.0001,
+        "lr_scheduler_type": "cosine",
+        "lr_scheduler_kwargs": {
+            "betas": [
+                0.95,
+                0.999
+            ],
+            "weight_decay": 1e-6,
+            "eps": 1e-8
+        },
+        "scheduler_specific_kwargs": {},
+        "data_parallel": "ddp",
+        "sharding_strategy": "full-shard",
+        "deepspeed_config": "/data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json",
+        "enable_gradient_checkpointing": true,
+        "enable_mixed_precision_training": true,
+        "reduce_in_full_precision": true,
+        "max_training_steps": 40000,
+        "num_train_epochs": null,
+        "warmup_steps": 1000,
+        "warmup_ratio": null
+    },
+    "data": {
+        "transform": {
+            "repack": {
+                "dataset_name": "simple",
+                "num_past_frames": 0,
+                "action_chunk_size": 16,
+                "pad_action_dim": 36,
+                "pad_state_dim": 36
+            },
+            "model": {
+                "resize": {
+                    "size": [
+                        256,
+                        480
+                    ]
+                },
+                "color_jitter": {
+                    "brightness": 0.2,
+                    "contrast": [
+                        0.8,
+                        1.2
+                    ],
+                    "saturation": [
+                        0.8,
+                        1.2
+                    ],
+                    "hue": 0.05
+                },
+                "center_crop": {
+                    "size": [
+                        224,
+                        224
+                    ]
+                },
+                "normalize": {
+                    "mean": [
+                        0.485,
+                        0.456,
+                        0.406
+                    ],
+                    "std": [
+                        0.229,
+                        0.224,
+                        0.225
+                    ]
+                },
+                "img_aug": true
+            },
+            "field": {
+                "stat_path": "meta/stats_psi0.json",
+                "action_norm_type": "bounds",
+                "stat_action_key": "action",
+                "stat_state_key": "states",
+                "use_norm_mask": false,
+                "action_norm_masks": [
+                    true,
+                    true,
+                    true,
+                    true,
+                    true,
+                    true,
+                    false
+                ],
+                "action_min": [
+                    -0.13059291243553162,
+                    -0.09108058363199234,
+                    -0.0024844733998179436,
+                    -0.20733775198459625,
+                    -0.15850023925304413,
+                    -0.17450474202632904,
+                    -0.2997315526008606,
+                    -0.015391111373901367,
+                    -0.34571564197540283,
+                    -0.4991437792778015,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0,
+                    -0.1015840545296669,
+                    -0.06647031009197235,
+                    -0.16578954458236694,
+                    -0.14477218687534332,
+                    -0.3665394186973572,
+                    -0.28364259004592896,
+                    -0.1775387078523636,
+                    -0.48419490456581116,
+                    -0.7551082968711853,
+                    -0.2692946195602417,
+                    -0.03164339065551758,
+                    -0.00003876500704791397,
+                    -0.3909206688404083,
+                    0.0,
+                    -0.04351663216948509,
+                    -0.014203650876879692,
+                    -0.049649015069007874,
+                    0.44999998807907104,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0
+                ],
+                "action_max": [
+                    0.08620641380548477,
+                    0.13058121502399445,
+                    0.22948147356510162,
+                    0.020551620051264763,
+                    0.005824880674481392,
+                    0.010019193403422832,
+                    8.43817247186962e-7,
+                    0.39566752314567566,
+                    0.0,
+                    0.0,
+                    0.4860266447067261,
+                    1.0467392206192017,
+                    0.6470075845718384,
+                    0.8298009037971497,
+                    0.03516175225377083,
+                    0.11019192636013031,
+                    0.04779902100563049,
+                    0.12850724160671234,
+                    0.000038688118365826085,
+                    0.0012142359046265483,
+                    0.000033343669201713055,
+                    0.002679983852431178,
+                    0.00041063950629904866,
+                    0.1973484456539154,
+                    0.2633756697177887,
+                    0.34943076968193054,
+                    0.0012102096807211637,
+                    0.8342975974082947,
+                    0.31870752573013306,
+                    0.45533719658851624,
+                    0.15729404985904694,
+                    0.75,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0
+                ],
+                "state_min": [
+                    -0.13899999856948853,
+                    -0.09099991619586945,
+                    -5.989517215532203e-11,
+                    -0.20900000631809235,
+                    -0.1589999943971634,
+                    -0.210999995470047,
+                    -0.3009999990463257,
+                    -0.01600000075995922,
+                    -0.1860000044107437,
+                    -0.6940000057220459,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0,
+                    -0.1019991859793663,
+                    -0.06899992376565933,
+                    -0.16899999976158142,
+                    -0.14499999582767487,
+                    -0.3709999918937683,
+                    -0.28700000047683716,
+                    -0.17800045013427734,
+                    -0.4869999885559082,
+                    -0.7599999904632568,
+                    -0.27300000190734863,
+                    -0.029999999329447746,
+                    0.0,
+                    -0.39100033044815063,
+                    -0.0010000000474974513,
+                    0.0,
+                    -0.15000000596046448,
+                    0.0,
+                    0.44999998807907104,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0
+                ],
+                "state_max": [
+                    0.0860000029206276,
+                    0.2720000147819519,
+                    0.23100000619888306,
+                    0.0,
+                    6.510182259944486e-8,
+                    0.0,
+                    0.0,
+                    0.5550000071525574,
+                    0.02100004442036152,
+                    0.0,
+                    0.5429999828338623,
+                    1.13100004196167,
+                    0.5770000219345093,
+                    0.9580000042915344,
+                    0.07141251862049103,
+                    0.10899999737739563,
+                    0.04699999839067459,
+                    0.13600000739097595,
+                    0.0,
+                    0.003000000026077032,
+                    0.0,
+                    0.009999999776482582,
+                    0.0020000000949949026,
+                    0.2029999941587448,
+                    0.2759999930858612,
+                    0.3499999940395355,
+                    0.003000000026077032,
+                    0.8370000123977661,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.75,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0
+                ],
+                "normalize_state": true,
+                "pad_action_dim": 36,
+                "pad_state_dim": 36
+            }
+        },
+        "root_dir": "/data/jliu/data",
+        "train_repo_ids": [
+            "G1WholebodyBendPick-v0"
+        ],
+        "val_repo_ids": [
+            "G1WholebodyBendPick-v0"
+        ]
+    },
+    "model": {
+        "num_diffusion_iters": 100,
+        "action_chunk_size": 16,
+        "num_cameras": 1,
+        "share_vision_encoder": false,
+        "obs_horizon": 1,
+        "action_exec_horizon": 6,
+        "action_dim": 36,
+        "obs_dim": 36
+    }
+}

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/debug-internal.log ADDED Viewed

The diff for this file is too large to render. See raw diff

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/debug.log ADDED Viewed

	@@ -0,0 +1,25 @@

+2026-03-18 14:26:30,764 INFO    MainThread:279364 [wandb_setup.py:_flush():81] Current SDK version is 0.25.1
+2026-03-18 14:26:30,764 INFO    MainThread:279364 [wandb_setup.py:_flush():81] Configure stats pid to 279364
+2026-03-18 14:26:30,764 INFO    MainThread:279364 [wandb_setup.py:_flush():81] Loading settings from environment variables
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:setup_run_log_directory():717] Logging user logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug.log
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:setup_run_log_directory():718] Logging internal logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug-internal.log
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:init():844] calling init triggers
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:init():849] wandb.init called with sweep_config: {}
+config: {'_wandb': {}}
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:init():892] starting backend
+2026-03-18 14:26:31,018 INFO    MainThread:279364 [wandb_init.py:init():895] sending inform_init request
+2026-03-18 14:26:31,028 INFO    MainThread:279364 [wandb_init.py:init():903] backend started and connected
+2026-03-18 14:26:31,029 INFO    MainThread:279364 [wandb_init.py:init():973] updated telemetry
+2026-03-18 14:26:31,035 INFO    MainThread:279364 [wandb_init.py:init():997] communicating run to backend with 90.0 second timeout
+2026-03-18 14:26:32,251 INFO    MainThread:279364 [wandb_init.py:init():1042] starting run threads in backend
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_console_start():2524] atexit reg
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_redirect():2373] redirect: wrap_raw
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_redirect():2442] Wrapping output streams.
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_redirect():2465] Redirects installed.
+2026-03-18 14:26:32,409 INFO    MainThread:279364 [wandb_init.py:init():1082] run started, returning control to user process
+2026-03-18 14:26:32,411 INFO    MainThread:279364 [wandb_run.py:_config_callback():1403] config_cb None None {'exp': 'g1wholebodybendpick-v0', 'seed': 2026, 'auto_tag_run': False, 'eval': False, 'debug': False, 'timestamp': '2603181426', 'log': {'logging_dir': 'logs', 'report_to': 'wandb', 'log_freq': 100}, 'wandb': {'project': 'psi', 'entity': 'jliu530-soochow-university', 'group': None, 'id': None, 'name': None, 'resume': 'allow'}, 'train': {'num_workers': 8, 'overfit_single_batch': False, 'name': 'diffusion-policy-g1', 'resume_from_checkpoint': None, 'skip_resumed_steps': False, 'hf_token': '.hf_token', 'lora': False, 'output_dir': '.runs', 'gradient_accumulation_steps': 1, 'mixed_precision': 'bf16', 'max_grad_norm': 1.0, 'optimizer_foreach': None, 'train_batch_size': 32, 'val_batch_size': 16, 'val_num_batches': 20, 'checkpointing_steps': 5000, 'max_checkpoints_to_keep': None, 'validation_steps': 500, 'learning_rate': 0.0001, 'lr_scheduler_type': 'cosine', 'lr_scheduler_kwargs': {'betas': [0.95, 0.999], 'weight_decay': 1e-06, 'eps': 1e-08}, 'scheduler_specific_kwargs': {}, 'data_parallel': 'ddp', 'sharding_strategy': 'full-shard', 'deepspeed_config': '/data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json', 'enable_gradient_checkpointing': True, 'enable_mixed_precision_training': True, 'reduce_in_full_precision': True, 'max_training_steps': 40000, 'num_train_epochs': None, 'warmup_steps': 1000, 'warmup_ratio': None}, 'data': {'transform': {'repack': {'dataset_name': 'simple', 'num_past_frames': 0, 'action_chunk_size': 16, 'pad_action_dim': 36, 'pad_state_dim': 36}, 'model': {'resize': {'size': [256, 480]}, 'color_jitter': {'brightness': 0.2, 'contrast': [0.8, 1.2], 'saturation': [0.8, 1.2], 'hue': 0.05}, 'center_crop': {'size': [224, 224]}, 'normalize': {'mean': [0.485, 0.456, 0.406], 'std': [0.229, 0.224, 0.225]}, 'img_aug': True}, 'field': {'stat_path': 'meta/stats_psi0.json', 'action_norm_type': 'bounds', 'stat_action_key': 'action', 'stat_state_key': 'states', 'use_norm_mask': False, 'action_norm_masks': [True, True, True, True, True, True, False], 'action_min': [-0.13059291243553162, -0.09108058363199234, -0.0024844733998179436, -0.20733775198459625, -0.15850023925304413, -0.17450474202632904, -0.2997315526008606, -0.015391111373901367, -0.34571564197540283, -0.4991437792778015, 0.0, 0.0, 0.0, 0.0, -0.1015840545296669, -0.06647031009197235, -0.16578954458236694, -0.14477218687534332, -0.3665394186973572, -0.28364259004592896, -0.1775387078523636, -0.48419490456581116, -0.7551082968711853, -0.2692946195602417, -0.03164339065551758, -3.876500704791397e-05, -0.3909206688404083, 0.0, -0.04351663216948509, -0.014203650876879692, -0.049649015069007874, 0.44999998807907104, 0.0, 0.0, 0.0, 0.0], 'action_max': [0.08620641380548477, 0.13058121502399445, 0.22948147356510162, 0.020551620051264763, 0.005824880674481392, 0.010019193403422832, 8.43817247186962e-07, 0.39566752314567566, 0.0, 0.0, 0.4860266447067261, 1.0467392206192017, 0.6470075845718384, 0.8298009037971497, 0.03516175225377083, 0.11019192636013031, 0.04779902100563049, 0.12850724160671234, 3.8688118365826085e-05, 0.0012142359046265483, 3.3343669201713055e-05, 0.002679983852431178, 0.00041063950629904866, 0.1973484456539154, 0.2633756697177887, 0.34943076968193054, 0.0012102096807211637, 0.8342975974082947, 0.31870752573013306, 0.45533719658851624, 0.15729404985904694, 0.75, 0.0, 0.0, 0.0, 0.0], 'state_min': [-0.13899999856948853, -0.09099991619586945, -5.989517215532203e-11, -0.20900000631809235, -0.1589999943971634, -0.210999995470047, -0.3009999990463257, -0.01600000075995922, -0.1860000044107437, -0.6940000057220459, 0.0, 0.0, 0.0, 0.0, -0.1019991859793663, -0.06899992376565933, -0.16899999976158142, -0.14499999582767487, -0.3709999918937683, -0.28700000047683716, -0.17800045013427734, -0.4869999885559082, -0.7599999904632568, -0.27300000190734863, -0.029999999329447746, 0.0, -0.39100033044815063, -0.0010000000474974513, 0.0, -0.15000000596046448, 0.0, 0.44999998807907104, 0.0, 0.0, 0.0, 0.0], 'state_max': [0.0860000029206276, 0.2720000147819519, 0.23100000619888306, 0.0, 6.510182259944486e-08, 0.0, 0.0, 0.5550000071525574, 0.02100004442036152, 0.0, 0.5429999828338623, 1.13100004196167, 0.5770000219345093, 0.9580000042915344, 0.07141251862049103, 0.10899999737739563, 0.04699999839067459, 0.13600000739097595, 0.0, 0.003000000026077032, 0.0, 0.009999999776482582, 0.0020000000949949026, 0.2029999941587448, 0.2759999930858612, 0.3499999940395355, 0.003000000026077032, 0.8370000123977661, 0.0, 0.0, 0.0, 0.75, 0.0, 0.0, 0.0, 0.0], 'normalize_state': True, 'pad_action_dim': 36, 'pad_state_dim': 36}}, 'root_dir': '/data/jliu/data', 'train_repo_ids': ['G1WholebodyBendPick-v0'], 'val_repo_ids': ['G1WholebodyBendPick-v0']}, 'model': {'num_diffusion_iters': 100, 'action_chunk_size': 16, 'num_cameras': 1, 'share_vision_encoder': False, 'obs_horizon': 1, 'action_exec_horizon': 6, 'action_dim': 36, 'obs_dim': 36}, 'environment_variables': {'OMP_NUM_THREADS': '32', 'HF_HOME': '/data/cache', 'TORCH_HOME': '/data/cache', 'HF_TOKEN': 'hf_...TiKa', 'HF_LEROBOT_HOME': '/data/data/lerobot', 'WE_HOME': 'Not Set', 'DATA_HOME': '/data/data', 'UV_CACHE_DIR': '/data/cache', 'WANDB_API_KEY': '90e...5c06', 'PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION': 'python', 'CUDA_VISIBLE_DEVICES': '0,1,2,3', 'WORLD_SIZE': '4', 'LOCAL_WORLD_SIZE': '4', 'RANK': '0', 'LOCAL_RANK': '0', 'MASTER_ADDR': 'nebula99', 'MASTER_PORT': '41289'}}
+2026-03-18 20:24:38,632 INFO    MainThread:279364 [wandb_run.py:_finish():2291] finishing run jliu530-soochow-university/psi/q4pxxlgy
+2026-03-18 20:24:38,634 INFO    MainThread:279364 [wandb_run.py:_atexit_cleanup():2490] got exitcode: 0
+2026-03-18 20:24:38,634 INFO    MainThread:279364 [wandb_run.py:_restore():2472] restore
+2026-03-18 20:24:38,635 INFO    MainThread:279364 [wandb_run.py:_restore():2478] restore done
+2026-03-18 20:24:39,775 INFO    MainThread:279364 [wandb_run.py:_footer_sync_info():3868] logging synced files

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/config.yaml ADDED Viewed

	@@ -0,0 +1,436 @@

+_wandb:
+    value:
+        cli_version: 0.25.1
+        e:
+            9to9pktd3ndtvl9vuv59f4rwekbfrlue:
+                args:
+                    - simple_dp_config
+                    - --seed=2026
+                    - --exp=g1wholebodybendpick-v0
+                    - --train.name=diffusion-policy-g1
+                    - --log.report-to=wandb
+                    - --train.data_parallel=ddp
+                    - --train.mixed_precision=bf16
+                    - --train.train-batch-size=32
+                    - --train.warmup-steps=1000
+                    - --train.warmup-ratio=None
+                    - --train.checkpointing-steps=5000
+                    - --train.validation_steps=500
+                    - --train.val_num_batches=20
+                    - --train.gradient_accumulation_steps=1
+                    - --train.max-training-steps=40000
+                    - --train.learning-rate=1e-4
+                    - --train.max-grad-norm=1.0
+                    - --train.lr_scheduler_kwargs.weight_decay=1e-6
+                    - --train.lr_scheduler_kwargs.betas
+                    - "0.95"
+                    - "0.999"
+                    - --train.lr_scheduler_type=cosine
+                    - --data.root_dir=/data/jliu/data
+                    - --data.train-repo-ids=G1WholebodyBendPick-v0
+                    - --data.transform.repack.action_chunk_size=16
+                    - --data.transform.repack.pad-action-dim=36
+                    - --data.transform.repack.pad-state-dim=36
+                    - --data.transform.field.stat-path=meta/stats_psi0.json
+                    - --data.transform.field.stat-action-key=action
+                    - --data.transform.field.stat-state-key=states
+                    - --data.transform.field.normalize-state
+                    - --data.transform.field.action-norm-type=bounds
+                    - --data.transform.field.pad-action-dim=36
+                    - --data.transform.field.pad-state-dim=36
+                    - --data.transform.model.img-aug
+                    - --model.action-chunk-size=16
+                    - --model.action-dim=36
+                    - --model.obs-dim=36
+                codePath: scripts/train.py
+                codePathLocal: scripts/train.py
+                cpu_count: 128
+                cpu_count_logical: 128
+                cudaVersion: "12.9"
+                disk:
+                    /:
+                        total: "105089261568"
+                        used: "99538145280"
+                email: jliu530@163.com
+                executable: /data/jliu/psi/.venv-dp/bin/python3
+                git:
+                    commit: 04614628ecb677f5f278e2d31c1103aed8127f26
+                    remote: https://github.com/songlin/psi.git
+                gpu: NVIDIA A100-SXM4-80GB
+                gpu_count: 8
+                gpu_nvidia:
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-37370f00-90f5-4e03-f763-7a35649e6783
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-d4b40383-188b-cc16-9180-20c1a71a777f
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-0f3d827c-66cf-04da-b182-4ed0414a2549
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-164a49bb-43d3-2250-59e2-1b40eee0757f
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-c0471f40-ae19-5371-a1af-da406ca30f83
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-d9040f59-13d3-6c37-4ea0-c6c751424527
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-f834d0e8-a118-24c7-5461-30fce111bea6
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-6e687915-3247-735c-6641-544540804e79
+                host: nebula99
+                memory:
+                    total: "1623177744384"
+                os: Linux-6.8.0-100-generic-x86_64-with-glibc2.39
+                program: /data/jliu/psi/scripts/train.py
+                python: CPython 3.10.20
+                root: /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426
+                startedAt: "2026-03-18T14:26:30.762673Z"
+                writerId: 9to9pktd3ndtvl9vuv59f4rwekbfrlue
+        m: []
+        python_version: 3.10.20
+        t:
+            "1":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 71
+                - 83
+            "2":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 51
+                - 71
+                - 83
+            "3":
+                - 2
+                - 13
+                - 61
+            "4": 3.10.20
+            "5": 0.25.1
+            "6": 4.44.2
+            "12": 0.25.1
+            "13": linux-x86_64
+auto_tag_run:
+    value: false
+data:
+    value:
+        root_dir: /data/jliu/data
+        train_repo_ids:
+            - G1WholebodyBendPick-v0
+        transform:
+            field:
+                action_max:
+                    - 0.08620641380548477
+                    - 0.13058121502399445
+                    - 0.22948147356510162
+                    - 0.020551620051264763
+                    - 0.005824880674481392
+                    - 0.010019193403422832
+                    - 8.43817247186962e-07
+                    - 0.39566752314567566
+                    - 0
+                    - 0
+                    - 0.4860266447067261
+                    - 1.0467392206192017
+                    - 0.6470075845718384
+                    - 0.8298009037971497
+                    - 0.03516175225377083
+                    - 0.11019192636013031
+                    - 0.04779902100563049
+                    - 0.12850724160671234
+                    - 3.8688118365826085e-05
+                    - 0.0012142359046265483
+                    - 3.3343669201713055e-05
+                    - 0.002679983852431178
+                    - 0.00041063950629904866
+                    - 0.1973484456539154
+                    - 0.2633756697177887
+                    - 0.34943076968193054
+                    - 0.0012102096807211637
+                    - 0.8342975974082947
+                    - 0.31870752573013306
+                    - 0.45533719658851624
+                    - 0.15729404985904694
+                    - 0.75
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                action_min:
+                    - -0.13059291243553162
+                    - -0.09108058363199234
+                    - -0.0024844733998179436
+                    - -0.20733775198459625
+                    - -0.15850023925304413
+                    - -0.17450474202632904
+                    - -0.2997315526008606
+                    - -0.015391111373901367
+                    - -0.34571564197540283
+                    - -0.4991437792778015
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                    - -0.1015840545296669
+                    - -0.06647031009197235
+                    - -0.16578954458236694
+                    - -0.14477218687534332
+                    - -0.3665394186973572
+                    - -0.28364259004592896
+                    - -0.1775387078523636
+                    - -0.48419490456581116
+                    - -0.7551082968711853
+                    - -0.2692946195602417
+                    - -0.03164339065551758
+                    - -3.876500704791397e-05
+                    - -0.3909206688404083
+                    - 0
+                    - -0.04351663216948509
+                    - -0.014203650876879692
+                    - -0.049649015069007874
+                    - 0.44999998807907104
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                action_norm_masks:
+                    - true
+                    - true
+                    - true
+                    - true
+                    - true
+                    - true
+                    - false
+                action_norm_type: bounds
+                normalize_state: true
+                pad_action_dim: 36
+                pad_state_dim: 36
+                stat_action_key: action
+                stat_path: meta/stats_psi0.json
+                stat_state_key: states
+                state_max:
+                    - 0.0860000029206276
+                    - 0.2720000147819519
+                    - 0.23100000619888306
+                    - 0
+                    - 6.510182259944486e-08
+                    - 0
+                    - 0
+                    - 0.5550000071525574
+                    - 0.02100004442036152
+                    - 0
+                    - 0.5429999828338623
+                    - 1.13100004196167
+                    - 0.5770000219345093
+                    - 0.9580000042915344
+                    - 0.07141251862049103
+                    - 0.10899999737739563
+                    - 0.04699999839067459
+                    - 0.13600000739097595
+                    - 0
+                    - 0.003000000026077032
+                    - 0
+                    - 0.009999999776482582
+                    - 0.0020000000949949026
+                    - 0.2029999941587448
+                    - 0.2759999930858612
+                    - 0.3499999940395355
+                    - 0.003000000026077032
+                    - 0.8370000123977661
+                    - 0
+                    - 0
+                    - 0
+                    - 0.75
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                state_min:
+                    - -0.13899999856948853
+                    - -0.09099991619586945
+                    - -5.989517215532203e-11
+                    - -0.20900000631809235
+                    - -0.1589999943971634
+                    - -0.210999995470047
+                    - -0.3009999990463257
+                    - -0.01600000075995922
+                    - -0.1860000044107437
+                    - -0.6940000057220459
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                    - -0.1019991859793663
+                    - -0.06899992376565933
+                    - -0.16899999976158142
+                    - -0.14499999582767487
+                    - -0.3709999918937683
+                    - -0.28700000047683716
+                    - -0.17800045013427734
+                    - -0.4869999885559082
+                    - -0.7599999904632568
+                    - -0.27300000190734863
+                    - -0.029999999329447746
+                    - 0
+                    - -0.39100033044815063
+                    - -0.0010000000474974513
+                    - 0
+                    - -0.15000000596046448
+                    - 0
+                    - 0.44999998807907104
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                use_norm_mask: false
+            model:
+                center_crop:
+                    size:
+                        - 224
+                        - 224
+                color_jitter:
+                    brightness: 0.2
+                    contrast:
+                        - 0.8
+                        - 1.2
+                    hue: 0.05
+                    saturation:
+                        - 0.8
+                        - 1.2
+                img_aug: true
+                normalize:
+                    mean:
+                        - 0.485
+                        - 0.456
+                        - 0.406
+                    std:
+                        - 0.229
+                        - 0.224
+                        - 0.225
+                resize:
+                    size:
+                        - 256
+                        - 480
+            repack:
+                action_chunk_size: 16
+                dataset_name: simple
+                num_past_frames: 0
+                pad_action_dim: 36
+                pad_state_dim: 36
+        val_repo_ids:
+            - G1WholebodyBendPick-v0
+debug:
+    value: false
+environment_variables:
+    value:
+        CUDA_VISIBLE_DEVICES: 0,1,2,3
+        DATA_HOME: /data/data
+        HF_HOME: /data/cache
+        HF_LEROBOT_HOME: /data/data/lerobot
+        HF_TOKEN: hf_...TiKa
+        LOCAL_RANK: "0"
+        LOCAL_WORLD_SIZE: "4"
+        MASTER_ADDR: nebula99
+        MASTER_PORT: "41289"
+        OMP_NUM_THREADS: "32"
+        PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION: python
+        RANK: "0"
+        TORCH_HOME: /data/cache
+        UV_CACHE_DIR: /data/cache
+        WANDB_API_KEY: 90e...5c06
+        WE_HOME: Not Set
+        WORLD_SIZE: "4"
+eval:
+    value: false
+exp:
+    value: g1wholebodybendpick-v0
+log:
+    value:
+        log_freq: 100
+        logging_dir: logs
+        report_to: wandb
+model:
+    value:
+        action_chunk_size: 16
+        action_dim: 36
+        action_exec_horizon: 6
+        num_cameras: 1
+        num_diffusion_iters: 100
+        obs_dim: 36
+        obs_horizon: 1
+        share_vision_encoder: false
+seed:
+    value: 2026
+timestamp:
+    value: "2603181426"
+train:
+    value:
+        checkpointing_steps: 5000
+        data_parallel: ddp
+        deepspeed_config: /data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json
+        enable_gradient_checkpointing: true
+        enable_mixed_precision_training: true
+        gradient_accumulation_steps: 1
+        hf_token: .hf_token
+        learning_rate: 0.0001
+        lora: false
+        lr_scheduler_kwargs:
+            betas:
+                - 0.95
+                - 0.999
+            eps: 1e-08
+            weight_decay: 1e-06
+        lr_scheduler_type: cosine
+        max_checkpoints_to_keep: null
+        max_grad_norm: 1
+        max_training_steps: 40000
+        mixed_precision: bf16
+        name: diffusion-policy-g1
+        num_train_epochs: null
+        num_workers: 8
+        optimizer_foreach: null
+        output_dir: .runs
+        overfit_single_batch: false
+        reduce_in_full_precision: true
+        resume_from_checkpoint: null
+        sharding_strategy: full-shard
+        skip_resumed_steps: false
+        train_batch_size: 32
+        val_batch_size: 16
+        val_num_batches: 20
+        validation_steps: 500
+        warmup_ratio: null
+        warmup_steps: 1000
+wandb:
+    value:
+        entity: jliu530-soochow-university
+        group: null
+        id: null
+        name: null
+        project: psi
+        resume: allow

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/output.log ADDED Viewed

	@@ -0,0 +1,224 @@

+[2;36m[14:26:32 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Saved configuration to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m               ]8;id=805427;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=514750;file:///data/jliu/psi/scripts/train.py#128\[2m128[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Training configurations:                                                                                                        ]8;id=2657;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=644039;file:///data/jliu/psi/scripts/train.py#181\[2m181[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> training task: [32m'diffusion-policy-g1'[0m                                                                                        ]8;id=471497;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=12046;file:///data/jliu/psi/scripts/train.py#182\[2m182[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> run name: g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m                                                  ]8;id=329497;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=220436;file:///data/jliu/psi/scripts/train.py#183\[2m183[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> seed: [1;36m2026[0m                                                                                                                  ]8;id=844246;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=394625;file:///data/jliu/psi/scripts/train.py#184\[2m184[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> mixed precision: torch.bfloat16                                                                                             ]8;id=356929;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=94020;file:///data/jliu/psi/scripts/train.py#185\[2m185[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> warmup steps: [1;36m1000[0m                                                                                                          ]8;id=147732;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=919050;file:///data/jliu/psi/scripts/train.py#186\[2m186[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> validation steps: [1;36m500[0m                                                                                                       ]8;id=25941;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=888976;file:///data/jliu/psi/scripts/train.py#187\[2m187[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> checkpoint steps: [1;36m5000[0m                                                                                                      ]8;id=95089;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=418144;file:///data/jliu/psi/scripts/train.py#188\[2m188[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> max gradient norm: [1;36m1.0[0m                                                                                                      ]8;id=122104;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=446109;file:///data/jliu/psi/scripts/train.py#189\[2m189[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> PyTorch version [1;36m2.8[0m.[1;36m0[0m available.                                                                                                    ]8;id=514883;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/datasets/config.py\[2mconfig.py[0m]8;;\[2m:[0m]8;id=417488;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/datasets/config.py#54\[2m54[0m]8;;\
+Resolving data files: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 188001.08it/s]
+Resolving data files: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 152797.96it/s]
+[2;36m[14:26:33 03/18][0m[2;36m [0m[34mINFO    [0m | >>     |=> Num training samples:                                                                                                       ]8;id=591396;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=971225;file:///data/jliu/psi/scripts/train.py#192\[2m192[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Training dataset size: [1;36m15[0m,[1;36m509[0m                                                                                           ]8;id=603472;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=235431;file:///data/jliu/psi/scripts/train.py#193\[2m193[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Val dataset size: [1;36m15[0m,[1;36m509[0m                                                                                                ]8;id=548632;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=929903;file:///data/jliu/psi/scripts/train.py#195\[2m195[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Initialize optimizers and schedulers[33m...[0m                                                                                         ]8;id=492873;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=149330;file:///data/jliu/psi/scripts/train.py#198\[2m198[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m ***** Running training *****                                                                                                    ]8;id=127940;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=657111;file:///data/jliu/psi/scripts/train.py#202\[2m202[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> Num training examples = [1;36m15509[0m                                                                                               ]8;id=974614;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=572136;file:///data/jliu/psi/scripts/train.py#203\[2m203[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> Max training Epochs = [1;36m328[0m                                                                                                   ]8;id=574775;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=838653;file:///data/jliu/psi/scripts/train.py#204\[2m204[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Total optimization steps = [1;36m40000[0m                                                                                        ]8;id=927413;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=421473;file:///data/jliu/psi/scripts/train.py#205\[2m205[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Num steps Per Epoch = [1;36m122[0m                                                                                               ]8;id=9727;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=34717;file:///data/jliu/psi/scripts/train.py#206\[2m206[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Effective training epochs = [1;36m1311.48[0m                                                                                     ]8;id=842580;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=548288;file:///data/jliu/psi/scripts/train.py#207\[2m207[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> Global train batch size [1m([0mw. parallel, distributed & accumulation[1m)[0m = [1;36m128[0m                                                     ]8;id=272745;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=726293;file:///data/jliu/psi/scripts/train.py#208\[2m208[0m]8;;\
+[2;36m[14:26:34 03/18][0m[2;36m [0m[34mINFO    [0m | >>         |=> Device train batch size = [1;36m32[0m                                                                                            ]8;id=521307;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=847206;file:///data/jliu/psi/scripts/train.py#209\[2m209[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Gradient Accumulation steps = [1;36m1[0m                                                                                         ]8;id=871789;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=304159;file:///data/jliu/psi/scripts/train.py#210\[2m210[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Num processes [1m([0mGPUs[1m)[0m = [1;36m4[0m                                                                                                ]8;id=459749;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=722818;file:///data/jliu/psi/scripts/train.py#211\[2m211[0m]8;;\
+[2;36m[14:26:35 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Accelerator runs in: .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m                 ]8;id=966756;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=191940;file:///data/jliu/psi/scripts/train.py#218\[2m218[0m]8;;\
+Traing steps:   0%|                                                                                                                                  | 0/40000 [00:00<?, ?it/s]/data/jliu/psi/.venv-dp/lib/python3.10/site-packages/transformers/deepspeed.py:24: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
+  warnings.warn(
+Traing steps:  25%|██████████████████████▍                                                                   | 9999/40000 [1:35:02<2:29:49,  3.34it/s, loss=0.0148, lr=8.7e-05]
+[2;36m[15:14:00 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=680052;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=279409;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_5000   [2m                   [0m
+[2;36m[15:14:03 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=898249;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=431290;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_5000/ [2m                    [0m
+[2;36m                 [0m         model.safetensors                                                                                                 [2m                    [0m
+[2;36m[15:14:04 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=224;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=473149;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_5000/ [2m                    [0m
+[2;36m                 [0m         optimizer.bin                                                                                                     [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=639771;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=832328;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_5000/ [2m                    [0m
+[2;36m                 [0m         scheduler.bin                                                                                                     [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=788377;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=572992;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_5000/ [2m                    [0m
+[2;36m                 [0m         sampler.bin                                                                                                       [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=374604;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=162278;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_5000/ [2m                    [0m
+[2;36m                 [0m         sampler_1.bin                                                                                                     [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=806908;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=971194;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_5000/ [2m                    [0m
+[2;36m                 [0m         random_states_0.pkl                                                                                               [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_5000
+[2;36m[16:01:38 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=755470;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=983054;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_10000  [2m                   [0m
+[2;36m[16:01:40 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=616494;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=137590;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_10000 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[16:01:42 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=304800;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=88534;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_10000 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=141920;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=821494;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_10000 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=532364;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=432054;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_10000 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=846104;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=206251;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_10000 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=930895;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=77000;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_10000 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_10000
+[2;36m[16:47:50 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=370569;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=979940;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_15000  [2m                   [0m
+[2;36m[16:47:51 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=535180;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=499147;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_15000 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[16:47:52 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=341880;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=958353;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_15000 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=599385;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=648655;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_15000 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=544854;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=217040;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_15000 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=627278;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=244660;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_15000 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=418546;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=35811;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_15000 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_15000
+[2;36m[17:33:53 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=47434;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=679719;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_20000  [2m                   [0m
+[2;36m[17:33:55 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=473768;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=910263;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_20000 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[17:33:56 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=745480;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=711599;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_20000 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=555678;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=229348;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_20000 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=144411;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=168181;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_20000 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=286058;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=446016;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_20000 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=401798;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=319720;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_20000 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_20000
+[2;36m[18:19:28 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=486450;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=521773;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_25000  [2m                   [0m
+[2;36m[18:19:30 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=490419;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=185558;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_25000 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[18:19:31 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=125939;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=552863;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_25000 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=855797;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=99159;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_25000 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m[18:19:32 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=999999;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=97642;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_25000 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=427821;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=571536;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_25000 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=702964;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=191314;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_25000 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_25000
+[2;36m[19:04:51 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=368785;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=589302;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_30000  [2m                   [0m
+[2;36m[19:04:52 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=227061;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=115021;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_30000 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[19:04:53 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=787738;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=595634;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_30000 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=590171;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=281123;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_30000 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=819504;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=276522;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_30000 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=717799;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=63361;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_30000 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=194505;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=677321;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_30000 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_30000
+[2;36m[19:49:58 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=290231;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=616676;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_35000  [2m                   [0m
+[2;36m[19:50:00 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=329883;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=169230;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_35000 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[19:50:01 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=431638;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=908584;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_35000 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=434664;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=16179;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_35000 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=324973;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=128996;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_35000 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=981583;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=899091;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_35000 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=636753;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=656123;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_35000 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_35000
+[2;36m[20:24:02 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=969664;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=423824;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_40000  [2m                   [0m
+[2;36m[20:24:04 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=485144;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=446823;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_40000 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[20:24:05 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=392321;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=903139;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_40000 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=407945;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=306059;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_40000 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=771109;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=749912;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_40000 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=729075;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=346604;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_40000 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=960350;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=128256;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_40000 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/checkpoints/ckpt_40000
+Training has reached maximum steps.
+[2;36m[20:24:35 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                              ]8;id=614052;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=946822;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_39999  [2m                   [0m
+[2;36m[20:24:37 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                              ]8;id=588107;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=58872;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_39999 [2m                    [0m
+[2;36m                 [0m         /model.safetensors                                                                                                [2m                    [0m
+[2;36m[20:24:38 03/18][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                            ]8;id=128644;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=124028;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_39999 [2m                    [0m
+[2;36m                 [0m         /optimizer.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                            ]8;id=625950;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=679365;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_39999 [2m                    [0m
+[2;36m                 [0m         /scheduler.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                             ]8;id=606210;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=132432;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_39999 [2m                    [0m
+[2;36m                 [0m         /sampler.bin                                                                                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                             ]8;id=250930;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=814323;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_39999 [2m                    [0m
+[2;36m                 [0m         /sampler_1.bin                                                                                                    [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                              ]8;id=131290;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=192379;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2603181426[0m/checkpoints/ckpt_39999 [2m                    [0m
+[2;36m                 [0m         /random_states_0.pkl                                                                                              [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Finalized DP Trainer. Epoch losses: [1m[[0m[1;36m0.0[0m, [1;36m1.0039703845977783[0m, [1;36m0.8921335339546204[0m,                  ]8;id=567626;file:///data/jliu/psi/src/psi/trainers/diffusion_policy_g1.py\[2mdiffusion_policy_g1.py[0m]8;;\[2m:[0m]8;id=716966;file:///data/jliu/psi/src/psi/trainers/diffusion_policy_g1.py#360\[2m360[0m]8;;\
+[2;36m                 [0m         [1;36m0.6254487037658691[0m, [1;36m0.4844936728477478[0m, [1;36m0.3499990701675415[0m[1m][0m                                                 [2m                          [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Happy Ending!                                                                                                    ]8;id=154857;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=239343;file:///data/jliu/psi/scripts/train.py#310\[2m310[0m]8;;\

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,205 @@

+tifffile==2025.5.10
+mpmath==1.3.0
+pynput==1.8.1
+llvmlite==0.46.0
+exceptiongroup==1.3.0
+sympy==1.14.0
+aiohttp-cors==0.8.1
+soupsieve==2.8
+Farama-Notifications==0.0.4
+numpydantic==1.6.7
+uvicorn==0.38.0
+waterbear==2.6.8
+nvidia-cudnn-cu12==9.10.2.21
+transformers==4.44.2
+cmake==4.2.3
+xxhash==3.5.0
+annotated-doc==0.0.4
+jsonlines==4.0.0
+nvidia-cuda-nvrtc-cu12==12.8.93
+pydantic==2.10.6
+triton==3.4.0
+nvidia-cufft-cu12==11.3.3.83
+multidict==6.6.4
+setuptools==82.0.1
+shtab==1.7.2
+pycollada==0.9.2
+beautifulsoup4==4.14.2
+msgspec==0.19.0
+huggingface-hub==0.35.3
+pydantic_core==2.27.2
+iniconfig==2.3.0
+zarr==2.18.3
+pytz==2025.2
+attrs==25.3.0
+requests==2.32.5
+hf_transfer==0.1.9
+numba==0.64.0
+einx==0.3.0
+scipy==1.15.3
+transforms3d==0.4.2
+pyzmq==27.1.0
+aiohappyeyeballs==2.6.1
+pymunk==7.2.0
+six==1.17.0
+expandvars==1.1.2
+prompt_toolkit==3.0.52
+wcwidth==0.6.0
+tomli==2.4.0
+ruamel.yaml.clib==0.2.14
+multiprocess==0.70.16
+vhacdx==0.0.9
+nvidia-cusparse-cu12==12.5.8.93
+aiosignal==1.4.0
+itsdangerous==2.2.0
+av==17.0.0
+nvidia-nccl-cu12==2.27.3
+httpx==0.28.1
+asciitree==0.3.3
+platformdirs==4.4.0
+sentry-sdk==2.39.0
+draccus==0.11.5
+nvidia-curand-cu12==10.3.9.90
+plotly==6.2.0
+jsonschema==4.25.1
+fastapi==0.119.1
+nvidia-nvjitlink-cu12==12.8.93
+fsspec==2025.3.0
+MarkupSafe==3.0.3
+pydantic-yaml==1.6.0
+h11==0.16.0
+typer==0.24.1
+mypy_extensions==1.1.0
+pytest==9.0.2
+h5py==3.14.0
+python-xlib==0.33
+lazy_loader==0.4
+einops==0.8.1
+albumentations==1.4.18
+params_proto==2.13.2
+fasteners==0.20
+psutil==7.1.0
+starlette==0.48.0
+anyio==4.11.0
+gdown==5.2.0
+charset-normalizer==3.4.3
+tyro==0.9.32
+filelock==3.19.1
+websockets==15.0.1
+accelerate==1.13.0
+python-dotenv==1.2.1
+orderly-set==5.5.0
+inquirerpy==0.3.4
+urllib3==2.5.0
+PyYAML==6.0.3
+rerun-sdk==0.23.1
+antlr4-python3-runtime==4.9.3
+mdurl==0.1.2
+omegaconf==2.3.0
+referencing==0.37.0
+pycparser==3.0
+pluggy==1.6.0
+torchvision==0.23.0
+docstring_parser==0.17.0
+wandb==0.25.1
+numpy==1.26.4
+GitPython==3.1.45
+opencv-python-headless==4.11.0.86
+cffi==2.0.0
+yourdfpy==0.0.58
+async-timeout==4.0.3
+shapely==2.1.2
+frozenlist==1.7.0
+simplejpeg==1.9.0
+nvidia-cuda-cupti-cu12==12.8.90
+Pygments==2.19.2
+rtree==1.4.1
+gitdb==4.0.12
+colorlog==6.10.1
+Werkzeug==3.1.6
+zipp==3.23.0
+albucore==0.0.17
+imageio==2.34.2
+frozendict==2.4.6
+jsonschema-specifications==2025.9.1
+rpds-py==0.28.0
+tokenizers==0.19.1
+blinker==1.9.0
+argparse==1.4.0
+nvidia-nvtx-cu12==12.8.90
+msgpack==1.1.1
+smmap==5.0.2
+packaging==25.0
+embreex==2.17.7.post7
+cloudpickle==3.1.2
+vuer==0.0.68
+propcache==0.3.2
+torchaudio==2.8.0
+pfzy==0.3.4
+dm-tree==0.1.8
+nvidia-cuda-runtime-cu12==12.8.90
+datasets==3.6.0
+numcodecs==0.13.1
+sniffio==1.3.1
+Jinja2==3.1.6
+narwhals==2.6.0
+gymnasium==0.29.1
+yarl==1.20.1
+typeguard==4.4.4
+termcolor==3.1.0
+importlib_metadata==8.7.1
+eval_type_backport==0.2.2
+certifi==2025.8.3
+tzdata==2025.2
+typing_extensions==4.15.0
+viser==1.0.15
+typing-inspect==0.9.0
+torch==2.8.0
+annotated-types==0.7.0
+svg.path==7.0
+mergedeep==1.3.4
+psi==0.0.0
+deepdiff==8.6.1
+nvidia-cufile-cu12==1.13.1.3
+toml==0.10.2
+click==8.3.0
+diffusers==0.30.2
+dotenv==0.9.9
+trimesh==4.8.3
+nvidia-cusparselt-cu12==0.7.1
+pyyaml-include==1.4.1
+scikit-image==0.25.2
+PySocks==1.7.1
+aiohttp==3.10.5
+regex==2026.2.28
+opencv-python==4.11.0.86
+nodeenv==1.9.1
+torchcodec==0.6.0
+protobuf==6.33.2
+pillow==11.3.0
+nvidia-cusolver-cu12==11.7.3.90
+idna==3.10
+Flask==3.1.3
+lerobot==0.1.0
+safetensors==0.7.0
+killport==1.2.0
+hf-xet==1.1.10
+nvidia-cublas-cu12==12.8.4.1
+imageio-ffmpeg==0.6.0
+httpcore==1.0.9
+networkx==3.4.2
+ruamel.yaml==0.18.15
+manifold3d==3.2.1
+shellingham==1.5.4
+mapbox_earcut==1.0.3
+pyarrow==21.0.0
+dill==0.3.8
+markdown-it-py==4.0.0
+tqdm==4.67.1
+argcomplete==3.6.2
+pandas==2.3.3
+lxml==6.0.2
+python-dateutil==2.9.0.post0
+evdev==1.9.3
+rich==14.1.0
+psi==0.0.0

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,129 @@

+{
+  "os": "Linux-6.8.0-100-generic-x86_64-with-glibc2.39",
+  "python": "CPython 3.10.20",
+  "startedAt": "2026-03-18T14:26:30.762673Z",
+  "args": [
+    "simple_dp_config",
+    "--seed=2026",
+    "--exp=g1wholebodybendpick-v0",
+    "--train.name=diffusion-policy-g1",
+    "--log.report-to=wandb",
+    "--train.data_parallel=ddp",
+    "--train.mixed_precision=bf16",
+    "--train.train-batch-size=32",
+    "--train.warmup-steps=1000",
+    "--train.warmup-ratio=None",
+    "--train.checkpointing-steps=5000",
+    "--train.validation_steps=500",
+    "--train.val_num_batches=20",
+    "--train.gradient_accumulation_steps=1",
+    "--train.max-training-steps=40000",
+    "--train.learning-rate=1e-4",
+    "--train.max-grad-norm=1.0",
+    "--train.lr_scheduler_kwargs.weight_decay=1e-6",
+    "--train.lr_scheduler_kwargs.betas",
+    "0.95",
+    "0.999",
+    "--train.lr_scheduler_type=cosine",
+    "--data.root_dir=/data/jliu/data",
+    "--data.train-repo-ids=G1WholebodyBendPick-v0",
+    "--data.transform.repack.action_chunk_size=16",
+    "--data.transform.repack.pad-action-dim=36",
+    "--data.transform.repack.pad-state-dim=36",
+    "--data.transform.field.stat-path=meta/stats_psi0.json",
+    "--data.transform.field.stat-action-key=action",
+    "--data.transform.field.stat-state-key=states",
+    "--data.transform.field.normalize-state",
+    "--data.transform.field.action-norm-type=bounds",
+    "--data.transform.field.pad-action-dim=36",
+    "--data.transform.field.pad-state-dim=36",
+    "--data.transform.model.img-aug",
+    "--model.action-chunk-size=16",
+    "--model.action-dim=36",
+    "--model.obs-dim=36"
+  ],
+  "program": "/data/jliu/psi/scripts/train.py",
+  "codePath": "scripts/train.py",
+  "codePathLocal": "scripts/train.py",
+  "git": {
+    "remote": "https://github.com/songlin/psi.git",
+    "commit": "04614628ecb677f5f278e2d31c1103aed8127f26"
+  },
+  "email": "jliu530@163.com",
+  "root": "/data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426",
+  "host": "nebula99",
+  "executable": "/data/jliu/psi/.venv-dp/bin/python3",
+  "cpu_count": 128,
+  "cpu_count_logical": 128,
+  "gpu": "NVIDIA A100-SXM4-80GB",
+  "gpu_count": 8,
+  "disk": {
+    "/": {
+      "total": "105089261568",
+      "used": "99538145280"
+    }
+  },
+  "memory": {
+    "total": "1623177744384"
+  },
+  "gpu_nvidia": [
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-37370f00-90f5-4e03-f763-7a35649e6783"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-d4b40383-188b-cc16-9180-20c1a71a777f"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-0f3d827c-66cf-04da-b182-4ed0414a2549"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-164a49bb-43d3-2250-59e2-1b40eee0757f"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-c0471f40-ae19-5371-a1af-da406ca30f83"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-d9040f59-13d3-6c37-4ea0-c6c751424527"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-f834d0e8-a118-24c7-5461-30fce111bea6"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-6e687915-3247-735c-6641-544540804e79"
+    }
+  ],
+  "cudaVersion": "12.9",
+  "writerId": "9to9pktd3ndtvl9vuv59f4rwekbfrlue"
+}

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"_step":40000,"val/denorm_err_l1_hand_joints":0.0031825141049921513,"val/denorm_err_l1_arm_joints":0.001931339385919273,"train/loss":0.0009651134605519474,"val/bc_loss":0.0009418176487088203,"_wandb":{"runtime":21486},"train/epoch":330,"val/denorm_err_l1_torso_vyaw":0,"val/denorm_err_l1_height":0.0013415103312581778,"_runtime":21486.385705629,"val/denorm_err_l1_rpy":0.0008791955769993365,"val/denorm_err_l1_torso_vx":0,"val/denorm_err_l1_torso_vy":0,"_timestamp":1.7738654759254735e+09,"val/denorm_err_l1_torso_target_yaw":0}

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug-internal.log ADDED Viewed

The diff for this file is too large to render. See raw diff

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug.log ADDED Viewed

	@@ -0,0 +1,25 @@

+2026-03-18 14:26:30,764 INFO    MainThread:279364 [wandb_setup.py:_flush():81] Current SDK version is 0.25.1
+2026-03-18 14:26:30,764 INFO    MainThread:279364 [wandb_setup.py:_flush():81] Configure stats pid to 279364
+2026-03-18 14:26:30,764 INFO    MainThread:279364 [wandb_setup.py:_flush():81] Loading settings from environment variables
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:setup_run_log_directory():717] Logging user logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug.log
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:setup_run_log_directory():718] Logging internal logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/logs/debug-internal.log
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:init():844] calling init triggers
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:init():849] wandb.init called with sweep_config: {}
+config: {'_wandb': {}}
+2026-03-18 14:26:30,765 INFO    MainThread:279364 [wandb_init.py:init():892] starting backend
+2026-03-18 14:26:31,018 INFO    MainThread:279364 [wandb_init.py:init():895] sending inform_init request
+2026-03-18 14:26:31,028 INFO    MainThread:279364 [wandb_init.py:init():903] backend started and connected
+2026-03-18 14:26:31,029 INFO    MainThread:279364 [wandb_init.py:init():973] updated telemetry
+2026-03-18 14:26:31,035 INFO    MainThread:279364 [wandb_init.py:init():997] communicating run to backend with 90.0 second timeout
+2026-03-18 14:26:32,251 INFO    MainThread:279364 [wandb_init.py:init():1042] starting run threads in backend
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_console_start():2524] atexit reg
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_redirect():2373] redirect: wrap_raw
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_redirect():2442] Wrapping output streams.
+2026-03-18 14:26:32,404 INFO    MainThread:279364 [wandb_run.py:_redirect():2465] Redirects installed.
+2026-03-18 14:26:32,409 INFO    MainThread:279364 [wandb_init.py:init():1082] run started, returning control to user process
+2026-03-18 14:26:32,411 INFO    MainThread:279364 [wandb_run.py:_config_callback():1403] config_cb None None {'exp': 'g1wholebodybendpick-v0', 'seed': 2026, 'auto_tag_run': False, 'eval': False, 'debug': False, 'timestamp': '2603181426', 'log': {'logging_dir': 'logs', 'report_to': 'wandb', 'log_freq': 100}, 'wandb': {'project': 'psi', 'entity': 'jliu530-soochow-university', 'group': None, 'id': None, 'name': None, 'resume': 'allow'}, 'train': {'num_workers': 8, 'overfit_single_batch': False, 'name': 'diffusion-policy-g1', 'resume_from_checkpoint': None, 'skip_resumed_steps': False, 'hf_token': '.hf_token', 'lora': False, 'output_dir': '.runs', 'gradient_accumulation_steps': 1, 'mixed_precision': 'bf16', 'max_grad_norm': 1.0, 'optimizer_foreach': None, 'train_batch_size': 32, 'val_batch_size': 16, 'val_num_batches': 20, 'checkpointing_steps': 5000, 'max_checkpoints_to_keep': None, 'validation_steps': 500, 'learning_rate': 0.0001, 'lr_scheduler_type': 'cosine', 'lr_scheduler_kwargs': {'betas': [0.95, 0.999], 'weight_decay': 1e-06, 'eps': 1e-08}, 'scheduler_specific_kwargs': {}, 'data_parallel': 'ddp', 'sharding_strategy': 'full-shard', 'deepspeed_config': '/data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json', 'enable_gradient_checkpointing': True, 'enable_mixed_precision_training': True, 'reduce_in_full_precision': True, 'max_training_steps': 40000, 'num_train_epochs': None, 'warmup_steps': 1000, 'warmup_ratio': None}, 'data': {'transform': {'repack': {'dataset_name': 'simple', 'num_past_frames': 0, 'action_chunk_size': 16, 'pad_action_dim': 36, 'pad_state_dim': 36}, 'model': {'resize': {'size': [256, 480]}, 'color_jitter': {'brightness': 0.2, 'contrast': [0.8, 1.2], 'saturation': [0.8, 1.2], 'hue': 0.05}, 'center_crop': {'size': [224, 224]}, 'normalize': {'mean': [0.485, 0.456, 0.406], 'std': [0.229, 0.224, 0.225]}, 'img_aug': True}, 'field': {'stat_path': 'meta/stats_psi0.json', 'action_norm_type': 'bounds', 'stat_action_key': 'action', 'stat_state_key': 'states', 'use_norm_mask': False, 'action_norm_masks': [True, True, True, True, True, True, False], 'action_min': [-0.13059291243553162, -0.09108058363199234, -0.0024844733998179436, -0.20733775198459625, -0.15850023925304413, -0.17450474202632904, -0.2997315526008606, -0.015391111373901367, -0.34571564197540283, -0.4991437792778015, 0.0, 0.0, 0.0, 0.0, -0.1015840545296669, -0.06647031009197235, -0.16578954458236694, -0.14477218687534332, -0.3665394186973572, -0.28364259004592896, -0.1775387078523636, -0.48419490456581116, -0.7551082968711853, -0.2692946195602417, -0.03164339065551758, -3.876500704791397e-05, -0.3909206688404083, 0.0, -0.04351663216948509, -0.014203650876879692, -0.049649015069007874, 0.44999998807907104, 0.0, 0.0, 0.0, 0.0], 'action_max': [0.08620641380548477, 0.13058121502399445, 0.22948147356510162, 0.020551620051264763, 0.005824880674481392, 0.010019193403422832, 8.43817247186962e-07, 0.39566752314567566, 0.0, 0.0, 0.4860266447067261, 1.0467392206192017, 0.6470075845718384, 0.8298009037971497, 0.03516175225377083, 0.11019192636013031, 0.04779902100563049, 0.12850724160671234, 3.8688118365826085e-05, 0.0012142359046265483, 3.3343669201713055e-05, 0.002679983852431178, 0.00041063950629904866, 0.1973484456539154, 0.2633756697177887, 0.34943076968193054, 0.0012102096807211637, 0.8342975974082947, 0.31870752573013306, 0.45533719658851624, 0.15729404985904694, 0.75, 0.0, 0.0, 0.0, 0.0], 'state_min': [-0.13899999856948853, -0.09099991619586945, -5.989517215532203e-11, -0.20900000631809235, -0.1589999943971634, -0.210999995470047, -0.3009999990463257, -0.01600000075995922, -0.1860000044107437, -0.6940000057220459, 0.0, 0.0, 0.0, 0.0, -0.1019991859793663, -0.06899992376565933, -0.16899999976158142, -0.14499999582767487, -0.3709999918937683, -0.28700000047683716, -0.17800045013427734, -0.4869999885559082, -0.7599999904632568, -0.27300000190734863, -0.029999999329447746, 0.0, -0.39100033044815063, -0.0010000000474974513, 0.0, -0.15000000596046448, 0.0, 0.44999998807907104, 0.0, 0.0, 0.0, 0.0], 'state_max': [0.0860000029206276, 0.2720000147819519, 0.23100000619888306, 0.0, 6.510182259944486e-08, 0.0, 0.0, 0.5550000071525574, 0.02100004442036152, 0.0, 0.5429999828338623, 1.13100004196167, 0.5770000219345093, 0.9580000042915344, 0.07141251862049103, 0.10899999737739563, 0.04699999839067459, 0.13600000739097595, 0.0, 0.003000000026077032, 0.0, 0.009999999776482582, 0.0020000000949949026, 0.2029999941587448, 0.2759999930858612, 0.3499999940395355, 0.003000000026077032, 0.8370000123977661, 0.0, 0.0, 0.0, 0.75, 0.0, 0.0, 0.0, 0.0], 'normalize_state': True, 'pad_action_dim': 36, 'pad_state_dim': 36}}, 'root_dir': '/data/jliu/data', 'train_repo_ids': ['G1WholebodyBendPick-v0'], 'val_repo_ids': ['G1WholebodyBendPick-v0']}, 'model': {'num_diffusion_iters': 100, 'action_chunk_size': 16, 'num_cameras': 1, 'share_vision_encoder': False, 'obs_horizon': 1, 'action_exec_horizon': 6, 'action_dim': 36, 'obs_dim': 36}, 'environment_variables': {'OMP_NUM_THREADS': '32', 'HF_HOME': '/data/cache', 'TORCH_HOME': '/data/cache', 'HF_TOKEN': 'hf_...TiKa', 'HF_LEROBOT_HOME': '/data/data/lerobot', 'WE_HOME': 'Not Set', 'DATA_HOME': '/data/data', 'UV_CACHE_DIR': '/data/cache', 'WANDB_API_KEY': '90e...5c06', 'PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION': 'python', 'CUDA_VISIBLE_DEVICES': '0,1,2,3', 'WORLD_SIZE': '4', 'LOCAL_WORLD_SIZE': '4', 'RANK': '0', 'LOCAL_RANK': '0', 'MASTER_ADDR': 'nebula99', 'MASTER_PORT': '41289'}}
+2026-03-18 20:24:38,632 INFO    MainThread:279364 [wandb_run.py:_finish():2291] finishing run jliu530-soochow-university/psi/q4pxxlgy
+2026-03-18 20:24:38,634 INFO    MainThread:279364 [wandb_run.py:_atexit_cleanup():2490] got exitcode: 0
+2026-03-18 20:24:38,634 INFO    MainThread:279364 [wandb_run.py:_restore():2472] restore
+2026-03-18 20:24:38,635 INFO    MainThread:279364 [wandb_run.py:_restore():2478] restore done
+2026-03-18 20:24:39,775 INFO    MainThread:279364 [wandb_run.py:_footer_sync_info():3868] logging synced files

dp/diffusion-policy-g1-sim/g1wholebodybendpick-v0.g1.cosine.lr1.0e-04.b128.gpus4.2603181426/wandb/run-20260318_142630-q4pxxlgy/run-q4pxxlgy.wandb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a15c7ce564f713397371a85e04f4c936fd2f9ef9099ffa03bfcbecfad655d1b9
+size 46453684

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/argv.txt ADDED Viewed

	@@ -0,0 +1,37 @@

+scripts/train.py
+simple_dp_config
+--seed=2026
+--exp=g1wholebodyhandover-v0
+--train.name=diffusion-policy-g1
+--log.report-to=wandb
+--train.data_parallel=ddp
+--train.mixed_precision=bf16
+--train.train-batch-size=32
+--train.warmup-steps=1000
+--train.warmup-ratio=None
+--train.checkpointing-steps=5000
+--train.validation_steps=500
+--train.val_num_batches=20
+--train.gradient_accumulation_steps=1
+--train.max-training-steps=40000
+--train.learning-rate=1e-4
+--train.max-grad-norm=1.0
+--train.lr_scheduler_kwargs.weight_decay=1e-6
+--train.lr_scheduler_kwargs.betas 0.95 0.999
+--train.lr_scheduler_type=cosine
+--data.root_dir=/data/jliu/data
+--data.train-repo-ids=G1WholebodyHandover-v0
+--data.transform.repack.action_chunk_size=16
+--data.transform.repack.pad-action-dim=36
+--data.transform.repack.pad-state-dim=36
+--data.transform.field.stat-path=meta/stats_psi0.json
+--data.transform.field.stat-action-key=action
+--data.transform.field.stat-state-key=states
+--data.transform.field.normalize-state
+--data.transform.field.action-norm-type=bounds
+--data.transform.field.pad-action-dim=36
+--data.transform.field.pad-state-dim=36
+--data.transform.model.img-aug
+--model.action-chunk-size=16
+--model.action-dim=36
+--model.obs-dim=36

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/ema_net.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c269fd0fba8f8419c012e3156fbcfe9dc0d718e76fe4bcce8ba6545074a01964
+size 337302879

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7e86eecf6975eb87fe7ae20127197f7b6d077b7a5cc4f01e1a6504a159b58c49
+size 337238328

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/optimizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bed6316f01241eca5edb869101e6b126cf9dddfdc0a43588f6b761f19c9ca548
+size 674602251

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_0.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bff892a7232cd4085a6a278617f383a57a337b8bd891ee607759e541b30875a6
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_1.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e712a43aee1ee2dda8edf287dd5d639562a2d9bdf3b9fd6d3b08ed07a27c1f5a
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_2.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a0289ed06080a05ed79ad2a7dbdd7fcf4e445e3adc604187a629769f203b3d5e
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/random_states_3.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b032d451de6e355991083548432d64f2eba42c38d119dcde8404311bf3f0ab54
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000/scheduler.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3ee6860bb6aecdd232f5d24bba08e626d7d56119a5f05ba8c2ad8eecf56fe38
+size 1465

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/envs.txt ADDED Viewed

	@@ -0,0 +1,17 @@

+OMP_NUM_THREADS=32
+HF_HOME=/data/cache
+TORCH_HOME=/data/cache
+HF_TOKEN=hf_...TiKa
+HF_LEROBOT_HOME=/data/data/lerobot
+WE_HOME=Not Set
+DATA_HOME=/data/data
+UV_CACHE_DIR=/data/cache
+WANDB_API_KEY=90e...5c06
+PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python
+CUDA_VISIBLE_DEVICES=4,5,6,7
+WORLD_SIZE=4
+LOCAL_WORLD_SIZE=4
+RANK=0
+LOCAL_RANK=0
+MASTER_ADDR=nebula99
+MASTER_PORT=38477

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/run_config.json ADDED Viewed

	@@ -0,0 +1,300 @@

+{
+    "exp": "g1wholebodyhandover-v0",
+    "seed": 2026,
+    "auto_tag_run": false,
+    "eval": false,
+    "debug": false,
+    "timestamp": "2604100204",
+    "log": {
+        "logging_dir": "logs",
+        "report_to": "wandb",
+        "log_freq": 100
+    },
+    "wandb": {
+        "project": "psi",
+        "entity": "jliu530-soochow-university",
+        "group": "diffusion-policy-g1",
+        "id": "sjem5sh4",
+        "name": "g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204",
+        "resume": "allow"
+    },
+    "train": {
+        "num_workers": 8,
+        "overfit_single_batch": false,
+        "name": "diffusion-policy-g1",
+        "resume_from_checkpoint": null,
+        "skip_resumed_steps": false,
+        "hf_token": ".hf_token",
+        "lora": false,
+        "output_dir": ".runs",
+        "gradient_accumulation_steps": 1,
+        "mixed_precision": "bf16",
+        "max_grad_norm": 1.0,
+        "optimizer_foreach": null,
+        "train_batch_size": 32,
+        "val_batch_size": 16,
+        "val_num_batches": 20,
+        "checkpointing_steps": 5000,
+        "max_checkpoints_to_keep": null,
+        "validation_steps": 500,
+        "learning_rate": 0.0001,
+        "lr_scheduler_type": "cosine",
+        "lr_scheduler_kwargs": {
+            "betas": [
+                0.95,
+                0.999
+            ],
+            "weight_decay": 1e-6,
+            "eps": 1e-8
+        },
+        "scheduler_specific_kwargs": {},
+        "data_parallel": "ddp",
+        "sharding_strategy": "full-shard",
+        "deepspeed_config": "/data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json",
+        "enable_gradient_checkpointing": true,
+        "enable_mixed_precision_training": true,
+        "reduce_in_full_precision": true,
+        "max_training_steps": 40000,
+        "num_train_epochs": null,
+        "warmup_steps": 1000,
+        "warmup_ratio": null
+    },
+    "data": {
+        "transform": {
+            "repack": {
+                "dataset_name": "simple",
+                "num_past_frames": 0,
+                "action_chunk_size": 16,
+                "pad_action_dim": 36,
+                "pad_state_dim": 36
+            },
+            "model": {
+                "resize": {
+                    "size": [
+                        256,
+                        480
+                    ]
+                },
+                "color_jitter": {
+                    "brightness": 0.2,
+                    "contrast": [
+                        0.8,
+                        1.2
+                    ],
+                    "saturation": [
+                        0.8,
+                        1.2
+                    ],
+                    "hue": 0.05
+                },
+                "center_crop": {
+                    "size": [
+                        224,
+                        224
+                    ]
+                },
+                "normalize": {
+                    "mean": [
+                        0.485,
+                        0.456,
+                        0.406
+                    ],
+                    "std": [
+                        0.229,
+                        0.224,
+                        0.225
+                    ]
+                },
+                "img_aug": true
+            },
+            "field": {
+                "stat_path": "meta/stats_psi0.json",
+                "action_norm_type": "bounds",
+                "stat_action_key": "action",
+                "stat_state_key": "states",
+                "use_norm_mask": false,
+                "action_norm_masks": [
+                    true,
+                    true,
+                    true,
+                    true,
+                    true,
+                    true,
+                    false
+                ],
+                "action_min": [
+                    -0.5,
+                    -1.1095792134107943e-16,
+                    -1.1095792134107943e-16,
+                    -1.5,
+                    -1.5,
+                    -1.5,
+                    -1.5,
+                    -0.5,
+                    -0.699999988079071,
+                    -0.699999988079071,
+                    -2.2166350627321588e-16,
+                    -2.2166350627321588e-16,
+                    0.0,
+                    -2.2166350627321588e-16,
+                    -0.47567468881607056,
+                    0.1900009959936142,
+                    -0.512170135974884,
+                    -0.6265152096748352,
+                    -0.5008617043495178,
+                    -0.8220608830451965,
+                    -0.9223371148109436,
+                    -0.49507391452789307,
+                    -0.3437551259994507,
+                    -0.6871383190155029,
+                    -0.7637607455253601,
+                    -0.7568023204803467,
+                    -0.576077401638031,
+                    -0.4588268995285034,
+                    -0.13876836001873016,
+                    -0.10360867530107498,
+                    -0.47856518626213074,
+                    0.7400000095367432,
+                    -0.5,
+                    -0.5,
+                    -0.26161932945251465,
+                    -0.06718750298023224
+                ],
+                "action_max": [
+                    0.5,
+                    0.699999988079071,
+                    0.699999988079071,
+                    0.0,
+                    2.2146225653890418e-16,
+                    2.2146225653890418e-16,
+                    2.2146225653890418e-16,
+                    1.2266071310501902e-19,
+                    1.1078670818917075e-16,
+                    1.1078670818917075e-16,
+                    1.5,
+                    1.5,
+                    0.6000000238418579,
+                    1.5,
+                    0.2472410947084427,
+                    0.7092280983924866,
+                    1.2571598291397095,
+                    0.42311304807662964,
+                    0.8564174771308899,
+                    0.5002086162567139,
+                    0.5172277092933655,
+                    0.16140148043632507,
+                    -0.1900009959936142,
+                    0.5362864136695862,
+                    0.5715147256851196,
+                    0.5002322196960449,
+                    0.566592276096344,
+                    0.6392397880554199,
+                    0.1580466777086258,
+                    0.2233395129442215,
+                    0.2582152187824249,
+                    0.7400000095367432,
+                    0.5,
+                    0.5,
+                    0.3454970121383667,
+                    0.2899305522441864
+                ],
+                "state_min": [
+                    -0.5564982891082764,
+                    -0.48307520151138306,
+                    -0.0005447770818136632,
+                    -0.8388738632202148,
+                    -1.3970016241073608,
+                    -0.8296014666557312,
+                    -1.4599460363388062,
+                    -0.5806806683540344,
+                    -0.5149835348129272,
+                    -0.6775947213172913,
+                    -0.001480442238971591,
+                    -0.0002713006397243589,
+                    -0.000914653530344367,
+                    -0.00019419840828049928,
+                    -0.4206617772579193,
+                    0.13972464203834534,
+                    -0.546251654624939,
+                    -0.5596316456794739,
+                    -0.4764360189437866,
+                    -0.7253566384315491,
+                    -0.9443663954734802,
+                    -0.4381798803806305,
+                    -0.3338131606578827,
+                    -0.667724072933197,
+                    -0.6881827116012573,
+                    -0.7544379830360413,
+                    -0.5189417600631714,
+                    -0.4484957158565521,
+                    -0.13709338009357452,
+                    -0.07360810041427612,
+                    -0.4748336970806122,
+                    0.7400000095367432,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0
+                ],
+                "state_max": [
+                    0.43566983938217163,
+                    0.3739710748195648,
+                    0.6575677990913391,
+                    0.004060761071741581,
+                    0.0005700877518393099,
+                    0.0004725759499706328,
+                    0.00010080631182063371,
+                    0.00001310737025050912,
+                    0.21882089972496033,
+                    0.0005271440604701638,
+                    0.530737042427063,
+                    1.4406861066818237,
+                    1.4605127573013306,
+                    1.4595911502838135,
+                    0.2663630545139313,
+                    0.657910943031311,
+                    1.2515853643417358,
+                    0.502498209476471,
+                    0.8292973637580872,
+                    0.5248894095420837,
+                    0.4653257131576538,
+                    0.18638382852077484,
+                    -0.16696421802043915,
+                    0.49318820238113403,
+                    0.6363148093223572,
+                    0.45773962140083313,
+                    0.6238265037536621,
+                    0.653800904750824,
+                    0.1436084657907486,
+                    0.25937986373901367,
+                    0.26422709226608276,
+                    0.7400000095367432,
+                    0.0,
+                    0.0,
+                    0.0,
+                    0.0
+                ],
+                "normalize_state": true,
+                "pad_action_dim": 36,
+                "pad_state_dim": 36
+            }
+        },
+        "root_dir": "/data/jliu/data",
+        "train_repo_ids": [
+            "G1WholebodyHandover-v0"
+        ],
+        "val_repo_ids": [
+            "G1WholebodyHandover-v0"
+        ]
+    },
+    "model": {
+        "num_diffusion_iters": 100,
+        "action_chunk_size": 16,
+        "num_cameras": 1,
+        "share_vision_encoder": false,
+        "obs_horizon": 1,
+        "action_exec_horizon": 6,
+        "action_dim": 36,
+        "obs_dim": 36
+    }
+}

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/debug-internal.log ADDED Viewed

The diff for this file is too large to render. See raw diff

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/debug.log ADDED Viewed

	@@ -0,0 +1,25 @@

+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_setup.py:_flush():81] Current SDK version is 0.25.1
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_setup.py:_flush():81] Configure stats pid to 1404689
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_setup.py:_flush():81] Loading settings from environment variables
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:setup_run_log_directory():717] Logging user logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug.log
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:setup_run_log_directory():718] Logging internal logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug-internal.log
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:init():844] calling init triggers
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:init():849] wandb.init called with sweep_config: {}
+config: {'_wandb': {}}
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:init():892] starting backend
+2026-04-10 02:05:01,257 INFO    MainThread:1404689 [wandb_init.py:init():895] sending inform_init request
+2026-04-10 02:05:01,265 INFO    MainThread:1404689 [wandb_init.py:init():903] backend started and connected
+2026-04-10 02:05:01,266 INFO    MainThread:1404689 [wandb_init.py:init():973] updated telemetry
+2026-04-10 02:05:01,272 INFO    MainThread:1404689 [wandb_init.py:init():997] communicating run to backend with 90.0 second timeout
+2026-04-10 02:05:02,182 INFO    MainThread:1404689 [wandb_init.py:init():1042] starting run threads in backend
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_console_start():2524] atexit reg
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_redirect():2373] redirect: wrap_raw
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_redirect():2442] Wrapping output streams.
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_redirect():2465] Redirects installed.
+2026-04-10 02:05:02,328 INFO    MainThread:1404689 [wandb_init.py:init():1082] run started, returning control to user process
+2026-04-10 02:05:02,329 INFO    MainThread:1404689 [wandb_run.py:_config_callback():1403] config_cb None None {'exp': 'g1wholebodyhandover-v0', 'seed': 2026, 'auto_tag_run': False, 'eval': False, 'debug': False, 'timestamp': '2604100204', 'log': {'logging_dir': 'logs', 'report_to': 'wandb', 'log_freq': 100}, 'wandb': {'project': 'psi', 'entity': 'jliu530-soochow-university', 'group': None, 'id': None, 'name': None, 'resume': 'allow'}, 'train': {'num_workers': 8, 'overfit_single_batch': False, 'name': 'diffusion-policy-g1', 'resume_from_checkpoint': None, 'skip_resumed_steps': False, 'hf_token': '.hf_token', 'lora': False, 'output_dir': '.runs', 'gradient_accumulation_steps': 1, 'mixed_precision': 'bf16', 'max_grad_norm': 1.0, 'optimizer_foreach': None, 'train_batch_size': 32, 'val_batch_size': 16, 'val_num_batches': 20, 'checkpointing_steps': 5000, 'max_checkpoints_to_keep': None, 'validation_steps': 500, 'learning_rate': 0.0001, 'lr_scheduler_type': 'cosine', 'lr_scheduler_kwargs': {'betas': [0.95, 0.999], 'weight_decay': 1e-06, 'eps': 1e-08}, 'scheduler_specific_kwargs': {}, 'data_parallel': 'ddp', 'sharding_strategy': 'full-shard', 'deepspeed_config': '/data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json', 'enable_gradient_checkpointing': True, 'enable_mixed_precision_training': True, 'reduce_in_full_precision': True, 'max_training_steps': 40000, 'num_train_epochs': None, 'warmup_steps': 1000, 'warmup_ratio': None}, 'data': {'transform': {'repack': {'dataset_name': 'simple', 'num_past_frames': 0, 'action_chunk_size': 16, 'pad_action_dim': 36, 'pad_state_dim': 36}, 'model': {'resize': {'size': [256, 480]}, 'color_jitter': {'brightness': 0.2, 'contrast': [0.8, 1.2], 'saturation': [0.8, 1.2], 'hue': 0.05}, 'center_crop': {'size': [224, 224]}, 'normalize': {'mean': [0.485, 0.456, 0.406], 'std': [0.229, 0.224, 0.225]}, 'img_aug': True}, 'field': {'stat_path': 'meta/stats_psi0.json', 'action_norm_type': 'bounds', 'stat_action_key': 'action', 'stat_state_key': 'states', 'use_norm_mask': False, 'action_norm_masks': [True, True, True, True, True, True, False], 'action_min': [-0.5, -1.1095792134107943e-16, -1.1095792134107943e-16, -1.5, -1.5, -1.5, -1.5, -0.5, -0.699999988079071, -0.699999988079071, -2.2166350627321588e-16, -2.2166350627321588e-16, 0.0, -2.2166350627321588e-16, -0.47567468881607056, 0.1900009959936142, -0.512170135974884, -0.6265152096748352, -0.5008617043495178, -0.8220608830451965, -0.9223371148109436, -0.49507391452789307, -0.3437551259994507, -0.6871383190155029, -0.7637607455253601, -0.7568023204803467, -0.576077401638031, -0.4588268995285034, -0.13876836001873016, -0.10360867530107498, -0.47856518626213074, 0.7400000095367432, -0.5, -0.5, -0.26161932945251465, -0.06718750298023224], 'action_max': [0.5, 0.699999988079071, 0.699999988079071, 0.0, 2.2146225653890418e-16, 2.2146225653890418e-16, 2.2146225653890418e-16, 1.2266071310501902e-19, 1.1078670818917075e-16, 1.1078670818917075e-16, 1.5, 1.5, 0.6000000238418579, 1.5, 0.2472410947084427, 0.7092280983924866, 1.2571598291397095, 0.42311304807662964, 0.8564174771308899, 0.5002086162567139, 0.5172277092933655, 0.16140148043632507, -0.1900009959936142, 0.5362864136695862, 0.5715147256851196, 0.5002322196960449, 0.566592276096344, 0.6392397880554199, 0.1580466777086258, 0.2233395129442215, 0.2582152187824249, 0.7400000095367432, 0.5, 0.5, 0.3454970121383667, 0.2899305522441864], 'state_min': [-0.5564982891082764, -0.48307520151138306, -0.0005447770818136632, -0.8388738632202148, -1.3970016241073608, -0.8296014666557312, -1.4599460363388062, -0.5806806683540344, -0.5149835348129272, -0.6775947213172913, -0.001480442238971591, -0.0002713006397243589, -0.000914653530344367, -0.00019419840828049928, -0.4206617772579193, 0.13972464203834534, -0.546251654624939, -0.5596316456794739, -0.4764360189437866, -0.7253566384315491, -0.9443663954734802, -0.4381798803806305, -0.3338131606578827, -0.667724072933197, -0.6881827116012573, -0.7544379830360413, -0.5189417600631714, -0.4484957158565521, -0.13709338009357452, -0.07360810041427612, -0.4748336970806122, 0.7400000095367432, 0.0, 0.0, 0.0, 0.0], 'state_max': [0.43566983938217163, 0.3739710748195648, 0.6575677990913391, 0.004060761071741581, 0.0005700877518393099, 0.0004725759499706328, 0.00010080631182063371, 1.310737025050912e-05, 0.21882089972496033, 0.0005271440604701638, 0.530737042427063, 1.4406861066818237, 1.4605127573013306, 1.4595911502838135, 0.2663630545139313, 0.657910943031311, 1.2515853643417358, 0.502498209476471, 0.8292973637580872, 0.5248894095420837, 0.4653257131576538, 0.18638382852077484, -0.16696421802043915, 0.49318820238113403, 0.6363148093223572, 0.45773962140083313, 0.6238265037536621, 0.653800904750824, 0.1436084657907486, 0.25937986373901367, 0.26422709226608276, 0.7400000095367432, 0.0, 0.0, 0.0, 0.0], 'normalize_state': True, 'pad_action_dim': 36, 'pad_state_dim': 36}}, 'root_dir': '/data/jliu/data', 'train_repo_ids': ['G1WholebodyHandover-v0'], 'val_repo_ids': ['G1WholebodyHandover-v0']}, 'model': {'num_diffusion_iters': 100, 'action_chunk_size': 16, 'num_cameras': 1, 'share_vision_encoder': False, 'obs_horizon': 1, 'action_exec_horizon': 6, 'action_dim': 36, 'obs_dim': 36}, 'environment_variables': {'OMP_NUM_THREADS': '32', 'HF_HOME': '/data/cache', 'TORCH_HOME': '/data/cache', 'HF_TOKEN': 'hf_...TiKa', 'HF_LEROBOT_HOME': '/data/data/lerobot', 'WE_HOME': 'Not Set', 'DATA_HOME': '/data/data', 'UV_CACHE_DIR': '/data/cache', 'WANDB_API_KEY': '90e...5c06', 'PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION': 'python', 'CUDA_VISIBLE_DEVICES': '4,5,6,7', 'WORLD_SIZE': '4', 'LOCAL_WORLD_SIZE': '4', 'RANK': '0', 'LOCAL_RANK': '0', 'MASTER_ADDR': 'nebula99', 'MASTER_PORT': '38477'}}
+2026-04-10 05:25:47,354 INFO    MainThread:1404689 [wandb_run.py:_finish():2291] finishing run jliu530-soochow-university/psi/sjem5sh4
+2026-04-10 05:25:47,355 INFO    MainThread:1404689 [wandb_run.py:_atexit_cleanup():2490] got exitcode: 0
+2026-04-10 05:25:47,356 INFO    MainThread:1404689 [wandb_run.py:_restore():2472] restore
+2026-04-10 05:25:47,356 INFO    MainThread:1404689 [wandb_run.py:_restore():2478] restore done
+2026-04-10 05:25:48,206 INFO    MainThread:1404689 [wandb_run.py:_footer_sync_info():3868] logging synced files

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/config.yaml ADDED Viewed

	@@ -0,0 +1,436 @@

+_wandb:
+    value:
+        cli_version: 0.25.1
+        e:
+            6ptlrch3t1wewxljiv5hkmtr0grgv5w6:
+                args:
+                    - simple_dp_config
+                    - --seed=2026
+                    - --exp=g1wholebodyhandover-v0
+                    - --train.name=diffusion-policy-g1
+                    - --log.report-to=wandb
+                    - --train.data_parallel=ddp
+                    - --train.mixed_precision=bf16
+                    - --train.train-batch-size=32
+                    - --train.warmup-steps=1000
+                    - --train.warmup-ratio=None
+                    - --train.checkpointing-steps=5000
+                    - --train.validation_steps=500
+                    - --train.val_num_batches=20
+                    - --train.gradient_accumulation_steps=1
+                    - --train.max-training-steps=40000
+                    - --train.learning-rate=1e-4
+                    - --train.max-grad-norm=1.0
+                    - --train.lr_scheduler_kwargs.weight_decay=1e-6
+                    - --train.lr_scheduler_kwargs.betas
+                    - "0.95"
+                    - "0.999"
+                    - --train.lr_scheduler_type=cosine
+                    - --data.root_dir=/data/jliu/data
+                    - --data.train-repo-ids=G1WholebodyHandover-v0
+                    - --data.transform.repack.action_chunk_size=16
+                    - --data.transform.repack.pad-action-dim=36
+                    - --data.transform.repack.pad-state-dim=36
+                    - --data.transform.field.stat-path=meta/stats_psi0.json
+                    - --data.transform.field.stat-action-key=action
+                    - --data.transform.field.stat-state-key=states
+                    - --data.transform.field.normalize-state
+                    - --data.transform.field.action-norm-type=bounds
+                    - --data.transform.field.pad-action-dim=36
+                    - --data.transform.field.pad-state-dim=36
+                    - --data.transform.model.img-aug
+                    - --model.action-chunk-size=16
+                    - --model.action-dim=36
+                    - --model.obs-dim=36
+                codePath: scripts/train.py
+                codePathLocal: scripts/train.py
+                cpu_count: 128
+                cpu_count_logical: 128
+                cudaVersion: "12.9"
+                disk:
+                    /:
+                        total: "105089261568"
+                        used: "82290688000"
+                email: jliu530@163.com
+                executable: /data/jliu/psi/.venv-dp/bin/python3
+                git:
+                    commit: 04614628ecb677f5f278e2d31c1103aed8127f26
+                    remote: https://github.com/songlin/psi.git
+                gpu: NVIDIA A100-SXM4-80GB
+                gpu_count: 8
+                gpu_nvidia:
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-02b51758-2aec-8c71-c751-92567fdb15ad
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-be645bb4-1ef0-15da-fc6b-53c5378650df
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-44868ccd-5809-61e2-f8cc-1dff8efc7eb1
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-a12b8de3-fb12-2901-c3a2-1e0e2b050b7b
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-57787183-4904-b2c9-cf52-1c1af976b365
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-e82d0fd0-9dcb-3d7c-9451-c4770ad6ddc3
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-9a825fa3-60d0-3acf-6c79-67e9230ae24c
+                    - architecture: Ampere
+                      cudaCores: 6912
+                      memoryTotal: "85899345920"
+                      name: NVIDIA A100-SXM4-80GB
+                      uuid: GPU-6fe02e5e-b886-9c02-e433-6237f3897dd8
+                host: nebula99
+                memory:
+                    total: "1623177445376"
+                os: Linux-6.8.0-106-generic-x86_64-with-glibc2.39
+                program: /data/jliu/psi/scripts/train.py
+                python: CPython 3.10.20
+                root: /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204
+                startedAt: "2026-04-10T02:05:01.005456Z"
+                writerId: 6ptlrch3t1wewxljiv5hkmtr0grgv5w6
+        m: []
+        python_version: 3.10.20
+        t:
+            "1":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 71
+                - 83
+            "2":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 51
+                - 71
+                - 83
+            "3":
+                - 2
+                - 13
+                - 61
+            "4": 3.10.20
+            "5": 0.25.1
+            "6": 4.44.2
+            "12": 0.25.1
+            "13": linux-x86_64
+auto_tag_run:
+    value: false
+data:
+    value:
+        root_dir: /data/jliu/data
+        train_repo_ids:
+            - G1WholebodyHandover-v0
+        transform:
+            field:
+                action_max:
+                    - 0.5
+                    - 0.699999988079071
+                    - 0.699999988079071
+                    - 0
+                    - 2.2146225653890418e-16
+                    - 2.2146225653890418e-16
+                    - 2.2146225653890418e-16
+                    - 1.2266071310501902e-19
+                    - 1.1078670818917075e-16
+                    - 1.1078670818917075e-16
+                    - 1.5
+                    - 1.5
+                    - 0.6000000238418579
+                    - 1.5
+                    - 0.2472410947084427
+                    - 0.7092280983924866
+                    - 1.2571598291397095
+                    - 0.42311304807662964
+                    - 0.8564174771308899
+                    - 0.5002086162567139
+                    - 0.5172277092933655
+                    - 0.16140148043632507
+                    - -0.1900009959936142
+                    - 0.5362864136695862
+                    - 0.5715147256851196
+                    - 0.5002322196960449
+                    - 0.566592276096344
+                    - 0.6392397880554199
+                    - 0.1580466777086258
+                    - 0.2233395129442215
+                    - 0.2582152187824249
+                    - 0.7400000095367432
+                    - 0.5
+                    - 0.5
+                    - 0.3454970121383667
+                    - 0.2899305522441864
+                action_min:
+                    - -0.5
+                    - -1.1095792134107943e-16
+                    - -1.1095792134107943e-16
+                    - -1.5
+                    - -1.5
+                    - -1.5
+                    - -1.5
+                    - -0.5
+                    - -0.699999988079071
+                    - -0.699999988079071
+                    - -2.2166350627321588e-16
+                    - -2.2166350627321588e-16
+                    - 0
+                    - -2.2166350627321588e-16
+                    - -0.47567468881607056
+                    - 0.1900009959936142
+                    - -0.512170135974884
+                    - -0.6265152096748352
+                    - -0.5008617043495178
+                    - -0.8220608830451965
+                    - -0.9223371148109436
+                    - -0.49507391452789307
+                    - -0.3437551259994507
+                    - -0.6871383190155029
+                    - -0.7637607455253601
+                    - -0.7568023204803467
+                    - -0.576077401638031
+                    - -0.4588268995285034
+                    - -0.13876836001873016
+                    - -0.10360867530107498
+                    - -0.47856518626213074
+                    - 0.7400000095367432
+                    - -0.5
+                    - -0.5
+                    - -0.26161932945251465
+                    - -0.06718750298023224
+                action_norm_masks:
+                    - true
+                    - true
+                    - true
+                    - true
+                    - true
+                    - true
+                    - false
+                action_norm_type: bounds
+                normalize_state: true
+                pad_action_dim: 36
+                pad_state_dim: 36
+                stat_action_key: action
+                stat_path: meta/stats_psi0.json
+                stat_state_key: states
+                state_max:
+                    - 0.43566983938217163
+                    - 0.3739710748195648
+                    - 0.6575677990913391
+                    - 0.004060761071741581
+                    - 0.0005700877518393099
+                    - 0.0004725759499706328
+                    - 0.00010080631182063371
+                    - 1.310737025050912e-05
+                    - 0.21882089972496033
+                    - 0.0005271440604701638
+                    - 0.530737042427063
+                    - 1.4406861066818237
+                    - 1.4605127573013306
+                    - 1.4595911502838135
+                    - 0.2663630545139313
+                    - 0.657910943031311
+                    - 1.2515853643417358
+                    - 0.502498209476471
+                    - 0.8292973637580872
+                    - 0.5248894095420837
+                    - 0.4653257131576538
+                    - 0.18638382852077484
+                    - -0.16696421802043915
+                    - 0.49318820238113403
+                    - 0.6363148093223572
+                    - 0.45773962140083313
+                    - 0.6238265037536621
+                    - 0.653800904750824
+                    - 0.1436084657907486
+                    - 0.25937986373901367
+                    - 0.26422709226608276
+                    - 0.7400000095367432
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                state_min:
+                    - -0.5564982891082764
+                    - -0.48307520151138306
+                    - -0.0005447770818136632
+                    - -0.8388738632202148
+                    - -1.3970016241073608
+                    - -0.8296014666557312
+                    - -1.4599460363388062
+                    - -0.5806806683540344
+                    - -0.5149835348129272
+                    - -0.6775947213172913
+                    - -0.001480442238971591
+                    - -0.0002713006397243589
+                    - -0.000914653530344367
+                    - -0.00019419840828049928
+                    - -0.4206617772579193
+                    - 0.13972464203834534
+                    - -0.546251654624939
+                    - -0.5596316456794739
+                    - -0.4764360189437866
+                    - -0.7253566384315491
+                    - -0.9443663954734802
+                    - -0.4381798803806305
+                    - -0.3338131606578827
+                    - -0.667724072933197
+                    - -0.6881827116012573
+                    - -0.7544379830360413
+                    - -0.5189417600631714
+                    - -0.4484957158565521
+                    - -0.13709338009357452
+                    - -0.07360810041427612
+                    - -0.4748336970806122
+                    - 0.7400000095367432
+                    - 0
+                    - 0
+                    - 0
+                    - 0
+                use_norm_mask: false
+            model:
+                center_crop:
+                    size:
+                        - 224
+                        - 224
+                color_jitter:
+                    brightness: 0.2
+                    contrast:
+                        - 0.8
+                        - 1.2
+                    hue: 0.05
+                    saturation:
+                        - 0.8
+                        - 1.2
+                img_aug: true
+                normalize:
+                    mean:
+                        - 0.485
+                        - 0.456
+                        - 0.406
+                    std:
+                        - 0.229
+                        - 0.224
+                        - 0.225
+                resize:
+                    size:
+                        - 256
+                        - 480
+            repack:
+                action_chunk_size: 16
+                dataset_name: simple
+                num_past_frames: 0
+                pad_action_dim: 36
+                pad_state_dim: 36
+        val_repo_ids:
+            - G1WholebodyHandover-v0
+debug:
+    value: false
+environment_variables:
+    value:
+        CUDA_VISIBLE_DEVICES: 4,5,6,7
+        DATA_HOME: /data/data
+        HF_HOME: /data/cache
+        HF_LEROBOT_HOME: /data/data/lerobot
+        HF_TOKEN: hf_...TiKa
+        LOCAL_RANK: "0"
+        LOCAL_WORLD_SIZE: "4"
+        MASTER_ADDR: nebula99
+        MASTER_PORT: "38477"
+        OMP_NUM_THREADS: "32"
+        PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION: python
+        RANK: "0"
+        TORCH_HOME: /data/cache
+        UV_CACHE_DIR: /data/cache
+        WANDB_API_KEY: 90e...5c06
+        WE_HOME: Not Set
+        WORLD_SIZE: "4"
+eval:
+    value: false
+exp:
+    value: g1wholebodyhandover-v0
+log:
+    value:
+        log_freq: 100
+        logging_dir: logs
+        report_to: wandb
+model:
+    value:
+        action_chunk_size: 16
+        action_dim: 36
+        action_exec_horizon: 6
+        num_cameras: 1
+        num_diffusion_iters: 100
+        obs_dim: 36
+        obs_horizon: 1
+        share_vision_encoder: false
+seed:
+    value: 2026
+timestamp:
+    value: "2604100204"
+train:
+    value:
+        checkpointing_steps: 5000
+        data_parallel: ddp
+        deepspeed_config: /data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json
+        enable_gradient_checkpointing: true
+        enable_mixed_precision_training: true
+        gradient_accumulation_steps: 1
+        hf_token: .hf_token
+        learning_rate: 0.0001
+        lora: false
+        lr_scheduler_kwargs:
+            betas:
+                - 0.95
+                - 0.999
+            eps: 1e-08
+            weight_decay: 1e-06
+        lr_scheduler_type: cosine
+        max_checkpoints_to_keep: null
+        max_grad_norm: 1
+        max_training_steps: 40000
+        mixed_precision: bf16
+        name: diffusion-policy-g1
+        num_train_epochs: null
+        num_workers: 8
+        optimizer_foreach: null
+        output_dir: .runs
+        overfit_single_batch: false
+        reduce_in_full_precision: true
+        resume_from_checkpoint: null
+        sharding_strategy: full-shard
+        skip_resumed_steps: false
+        train_batch_size: 32
+        val_batch_size: 16
+        val_num_batches: 20
+        validation_steps: 500
+        warmup_ratio: null
+        warmup_steps: 1000
+wandb:
+    value:
+        entity: jliu530-soochow-university
+        group: null
+        id: null
+        name: null
+        project: psi
+        resume: allow

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/output.log ADDED Viewed

	@@ -0,0 +1,230 @@

+[2;36m[02:05:02 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Saved configuration to                                                                               ]8;id=805427;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=514750;file:///data/jliu/psi/scripts/train.py#128\[2m128[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m                    [2m            [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Training configurations:                                                                             ]8;id=2657;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=644039;file:///data/jliu/psi/scripts/train.py#181\[2m181[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> training task: [32m'diffusion-policy-g1'[0m                                                             ]8;id=471497;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=12046;file:///data/jliu/psi/scripts/train.py#182\[2m182[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> run name: g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m                       ]8;id=329497;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=220436;file:///data/jliu/psi/scripts/train.py#183\[2m183[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> seed: [1;36m2026[0m                                                                                       ]8;id=844246;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=394625;file:///data/jliu/psi/scripts/train.py#184\[2m184[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> mixed precision: torch.bfloat16                                                                  ]8;id=356929;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=94020;file:///data/jliu/psi/scripts/train.py#185\[2m185[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> warmup steps: [1;36m1000[0m                                                                               ]8;id=147732;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=919050;file:///data/jliu/psi/scripts/train.py#186\[2m186[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> validation steps: [1;36m500[0m                                                                            ]8;id=25941;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=888976;file:///data/jliu/psi/scripts/train.py#187\[2m187[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> checkpoint steps: [1;36m5000[0m                                                                           ]8;id=95089;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=418144;file:///data/jliu/psi/scripts/train.py#188\[2m188[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> max gradient norm: [1;36m1.0[0m                                                                           ]8;id=122104;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=446109;file:///data/jliu/psi/scripts/train.py#189\[2m189[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> PyTorch version [1;36m2.8[0m.[1;36m0[0m available.                                                                         ]8;id=514883;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/datasets/config.py\[2mconfig.py[0m]8;;\[2m:[0m]8;id=417488;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/datasets/config.py#54\[2m54[0m]8;;\
+Resolving data files: 100%|███████████████████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 229699.01it/s]
+Resolving data files: 100%|███████████████████████████████████████████████████████████████████████████████████| 100/100 [00:00<00:00, 195174.69it/s]
+[2;36m[02:05:04 04/10][0m[2;36m [0m[34mINFO    [0m | >>     |=> Num training samples:                                                                            ]8;id=591396;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=971225;file:///data/jliu/psi/scripts/train.py#192\[2m192[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Training dataset size: [1;36m45[0m,[1;36m530[0m                                                                ]8;id=603472;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=235431;file:///data/jliu/psi/scripts/train.py#193\[2m193[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Val dataset size: [1;36m45[0m,[1;36m530[0m                                                                     ]8;id=548632;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=929903;file:///data/jliu/psi/scripts/train.py#195\[2m195[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Initialize optimizers and schedulers[33m...[0m                                                              ]8;id=492873;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=149330;file:///data/jliu/psi/scripts/train.py#198\[2m198[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m ***** Running training *****                                                                         ]8;id=127940;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=657111;file:///data/jliu/psi/scripts/train.py#202\[2m202[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> Num training examples = [1;36m45530[0m                                                                    ]8;id=974614;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=572136;file:///data/jliu/psi/scripts/train.py#203\[2m203[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> Max training Epochs = [1;36m113[0m                                                                        ]8;id=574775;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=838653;file:///data/jliu/psi/scripts/train.py#204\[2m204[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Total optimization steps = [1;36m40000[0m                                                             ]8;id=927413;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=421473;file:///data/jliu/psi/scripts/train.py#205\[2m205[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Num steps Per Epoch = [1;36m356[0m                                                                    ]8;id=9727;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=34717;file:///data/jliu/psi/scripts/train.py#206\[2m206[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Effective training epochs = [1;36m449.44[0m                                                           ]8;id=842580;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=548288;file:///data/jliu/psi/scripts/train.py#207\[2m207[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>     |=> Global train batch size [1m([0mw. parallel, distributed & accumulation[1m)[0m = [1;36m128[0m                          ]8;id=272745;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=726293;file:///data/jliu/psi/scripts/train.py#208\[2m208[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Device train batch size = [1;36m32[0m                                                                 ]8;id=521307;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=847206;file:///data/jliu/psi/scripts/train.py#209\[2m209[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Gradient Accumulation steps = [1;36m1[0m                                                              ]8;id=871789;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=304159;file:///data/jliu/psi/scripts/train.py#210\[2m210[0m]8;;\
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >>         |=> Num processes [1m([0mGPUs[1m)[0m = [1;36m4[0m                                                                     ]8;id=459749;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=722818;file:///data/jliu/psi/scripts/train.py#211\[2m211[0m]8;;\
+[2;36m[02:05:05 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Accelerator runs in:                                                                                 ]8;id=966756;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=191940;file:///data/jliu/psi/scripts/train.py#218\[2m218[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m                    [2m            [0m
+Traing steps:   0%|                                                                                                       | 0/40000 [00:00<?, ?it/s]/data/jliu/psi/.venv-dp/lib/python3.10/site-packages/transformers/deepspeed.py:24: FutureWarning: transformers.deepspeed module is deprecated and will be removed in a future version. Please import deepspeed modules directly from transformers.integrations
+  warnings.warn(
+Traing steps:  25%|████████████████▏                                                | 9999/40000 [49:36<1:10:18,  7.11it/s, loss=0.0173, lr=8.7e-05]
+[2;36m[02:30:02 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                  ]8;id=680052;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=279409;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints [2m                   [0m
+[2;36m                 [0m         /ckpt_5000                                                                                             [2m                   [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                  ]8;id=898249;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=431290;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoint [2m                    [0m
+[2;36m                 [0m         s/ckpt_5000/model.safetensors                                                                         [2m                    [0m
+[2;36m[02:30:03 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                ]8;id=224;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=473149;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoint [2m                    [0m
+[2;36m                 [0m         s/ckpt_5000/optimizer.bin                                                                             [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                ]8;id=639771;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=832328;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoint [2m                    [0m
+[2;36m                 [0m         s/ckpt_5000/scheduler.bin                                                                             [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                 ]8;id=788377;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=572992;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoint [2m                    [0m
+[2;36m                 [0m         s/ckpt_5000/sampler.bin                                                                               [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                 ]8;id=374604;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=162278;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoint [2m                    [0m
+[2;36m                 [0m         s/ckpt_5000/sampler_1.bin                                                                             [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                  ]8;id=806908;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=971194;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoint [2m                    [0m
+[2;36m                 [0m         s/ckpt_5000/random_states_0.pkl                                                                       [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_5000
+[2;36m[02:54:44 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                                    ]8;id=755470;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=983054;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_10000        [2m                   [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                                    ]8;id=616494;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=137590;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_10000/model [2m                    [0m
+[2;36m                 [0m         .safetensors                                                                                                            [2m                    [0m
+[2;36m[02:54:45 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                                  ]8;id=304800;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=88534;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_10000/optim [2m                    [0m
+[2;36m                 [0m         izer.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                                  ]8;id=141920;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=821494;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_10000/sched [2m                    [0m
+[2;36m                 [0m         uler.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                                   ]8;id=532364;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=432054;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_10000/sampl [2m                    [0m
+[2;36m                 [0m         er.bin                                                                                                                  [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                                   ]8;id=846104;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=206251;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_10000/sampl [2m                    [0m
+[2;36m                 [0m         er_1.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                                    ]8;id=930895;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=77000;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_10000/rando [2m                    [0m
+[2;36m                 [0m         m_states_0.pkl                                                                                                          [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_10000
+[2;36m[03:19:31 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                                    ]8;id=370569;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=979940;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_15000        [2m                   [0m
+[2;36m[03:19:32 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                                    ]8;id=535180;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=499147;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_15000/model [2m                    [0m
+[2;36m                 [0m         .safetensors                                                                                                            [2m                    [0m
+[2;36m[03:19:33 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                                  ]8;id=341880;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=958353;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_15000/optim [2m                    [0m
+[2;36m                 [0m         izer.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                                  ]8;id=599385;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=648655;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_15000/sched [2m                    [0m
+[2;36m                 [0m         uler.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                                   ]8;id=544854;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=217040;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_15000/sampl [2m                    [0m
+[2;36m                 [0m         er.bin                                                                                                                  [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                                   ]8;id=627278;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=244660;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_15000/sampl [2m                    [0m
+[2;36m                 [0m         er_1.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                                    ]8;id=418546;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=35811;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_15000/rando [2m                    [0m
+[2;36m                 [0m         m_states_0.pkl                                                                                                          [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_15000
+[2;36m[03:44:13 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                                    ]8;id=47434;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=679719;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_20000        [2m                   [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                                    ]8;id=473768;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=910263;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_20000/model [2m                    [0m
+[2;36m                 [0m         .safetensors                                                                                                            [2m                    [0m
+[2;36m[03:44:14 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                                  ]8;id=745480;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=711599;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_20000/optim [2m                    [0m
+[2;36m                 [0m         izer.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                                  ]8;id=555678;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=229348;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_20000/sched [2m                    [0m
+[2;36m                 [0m         uler.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                                   ]8;id=144411;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=168181;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_20000/sampl [2m                    [0m
+[2;36m                 [0m         er.bin                                                                                                                  [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                                   ]8;id=286058;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=446016;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_20000/sampl [2m                    [0m
+[2;36m                 [0m         er_1.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                                    ]8;id=401798;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=319720;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_20000/rando [2m                    [0m
+[2;36m                 [0m         m_states_0.pkl                                                                                                          [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_20000
+[2;36m[04:08:59 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                                    ]8;id=486450;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=521773;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_25000        [2m                   [0m
+[2;36m[04:09:00 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                                    ]8;id=490419;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=185558;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_25000/model [2m                    [0m
+[2;36m                 [0m         .safetensors                                                                                                            [2m                    [0m
+[2;36m[04:09:01 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                                  ]8;id=125939;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=552863;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_25000/optim [2m                    [0m
+[2;36m                 [0m         izer.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                                  ]8;id=855797;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=99159;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_25000/sched [2m                    [0m
+[2;36m                 [0m         uler.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                                   ]8;id=999999;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=97642;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_25000/sampl [2m                    [0m
+[2;36m                 [0m         er.bin                                                                                                                  [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                                   ]8;id=427821;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=571536;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_25000/sampl [2m                    [0m
+[2;36m                 [0m         er_1.bin                                                                                                                [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                                    ]8;id=702964;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=191314;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_25000/rando [2m                    [0m
+[2;36m                 [0m         m_states_0.pkl                                                                                                          [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_25000
+[2;36m[04:34:04 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                                ]8;id=368785;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=589302;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_30000    [2m                   [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                                ]8;id=227061;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=115021;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_30000/m [2m                    [0m
+[2;36m                 [0m         odel.safetensors                                                                                                    [2m                    [0m
+[2;36m[04:34:05 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                              ]8;id=787738;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=595634;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_30000/o [2m                    [0m
+[2;36m                 [0m         ptimizer.bin                                                                                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                              ]8;id=590171;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=281123;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_30000/s [2m                    [0m
+[2;36m                 [0m         cheduler.bin                                                                                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                               ]8;id=819504;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=276522;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_30000/s [2m                    [0m
+[2;36m                 [0m         ampler.bin                                                                                                          [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                               ]8;id=717799;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=63361;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_30000/s [2m                    [0m
+[2;36m                 [0m         ampler_1.bin                                                                                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                                ]8;id=194505;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=677321;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_30000/r [2m                    [0m
+[2;36m                 [0m         andom_states_0.pkl                                                                                                  [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_30000
+[2;36m[04:59:40 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                                                                ]8;id=290231;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=616676;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_35000    [2m                   [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                                                                ]8;id=329883;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=169230;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_35000/m [2m                    [0m
+[2;36m                 [0m         odel.safetensors                                                                                                    [2m                    [0m
+[2;36m[04:59:41 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                                                              ]8;id=431638;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=908584;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_35000/o [2m                    [0m
+[2;36m                 [0m         ptimizer.bin                                                                                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                                                              ]8;id=434664;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=16179;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_35000/s [2m                    [0m
+[2;36m                 [0m         cheduler.bin                                                                                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                                                               ]8;id=324973;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=128996;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_35000/s [2m                    [0m
+[2;36m                 [0m         ampler.bin                                                                                                          [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                                                               ]8;id=981583;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=899091;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_35000/s [2m                    [0m
+[2;36m                 [0m         ampler_1.bin                                                                                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                                                                ]8;id=636753;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=656123;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m2604100204[0m/checkpoints/ckpt_35000/r [2m                    [0m
+[2;36m                 [0m         andom_states_0.pkl                                                                                                  [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_35000
+[2;36m[05:25:16 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                               ]8;id=969664;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=423824;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m260[0m [2m                   [0m
+[2;36m                 [0m         [1;36m4100204[0m/checkpoints/ckpt_40000                                                      [2m                   [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                               ]8;id=485144;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=446823;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_40000/model.safetensors                                  [2m                    [0m
+[2;36m[05:25:17 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                             ]8;id=392321;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=903139;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_40000/optimizer.bin                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                             ]8;id=407945;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=306059;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_40000/scheduler.bin                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                              ]8;id=771109;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=749912;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_40000/sampler.bin                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                              ]8;id=729075;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=346604;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_40000/sampler_1.bin                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                               ]8;id=960350;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=128256;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_40000/random_states_0.pkl                                [2m                    [0m
+Saved state to .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/checkpoints/ckpt_40000
+Training has reached maximum steps.
+[2;36m[05:25:45 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Saving current state to                                               ]8;id=614052;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py\[2maccelerator.py[0m]8;;\[2m:[0m]8;id=946822;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/accelerator.py#3632\[2m3632[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m260[0m [2m                   [0m
+[2;36m                 [0m         [1;36m4100204[0m/checkpoints/ckpt_39999                                                      [2m                   [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Model weights saved in                                               ]8;id=588107;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=58872;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#115\[2m115[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_39999/model.safetensors                                  [2m                    [0m
+[2;36m[05:25:46 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Optimizer state saved in                                             ]8;id=128644;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=124028;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#122\[2m122[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_39999/optimizer.bin                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Scheduler state saved in                                             ]8;id=625950;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=679365;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#129\[2m129[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_39999/scheduler.bin                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m0[0m saved in                              ]8;id=606210;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=132432;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_39999/sampler.bin                                        [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Sampler state for dataloader [1;36m1[0m saved in                              ]8;id=250930;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=814323;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#146\[2m146[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_39999/sampler_1.bin                                      [2m                    [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0mRANK [1;36m0[0m[1m][0m Random states saved in                                               ]8;id=131290;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py\[2mcheckpointing.py[0m]8;;\[2m:[0m]8;id=192379;file:///data/jliu/psi/.venv-dp/lib/python3.10/site-packages/accelerate/checkpointing.py#179\[2m179[0m]8;;\
+[2;36m                 [0m         .runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.[1;36m0e-04[0m.b128.gpus4.[1;36m26[0m [2m                    [0m
+[2;36m                 [0m         [1;36m04100204[0m/checkpoints/ckpt_39999/random_states_0.pkl                                [2m                    [0m
+[2;36m[05:25:47 04/10][0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Finalized DP Trainer. Epoch losses: [1m[[0m[1;36m0.0[0m, [1;36m0.6723278164863586[0m,       ]8;id=567626;file:///data/jliu/psi/src/psi/trainers/diffusion_policy_g1.py\[2mdiffusion_policy_g1.py[0m]8;;\[2m:[0m]8;id=716966;file:///data/jliu/psi/src/psi/trainers/diffusion_policy_g1.py#360\[2m360[0m]8;;\
+[2;36m                 [0m         [1;36m0.2651745080947876[0m, [1;36m0.13162203133106232[0m, [1;36m0.11490532010793686[0m,                [2m                          [0m
+[2;36m                 [0m         [1;36m0.06330759078264236[0m[1m][0m                                                         [2m                          [0m
+[2;36m                [0m[2;36m [0m[34mINFO    [0m | >> [1m[[0m*[1m][0m Happy Ending!                                                                     ]8;id=154857;file:///data/jliu/psi/scripts/train.py\[2mtrain.py[0m]8;;\[2m:[0m]8;id=239343;file:///data/jliu/psi/scripts/train.py#310\[2m310[0m]8;;\

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,205 @@

+tifffile==2025.5.10
+mpmath==1.3.0
+pynput==1.8.1
+llvmlite==0.46.0
+exceptiongroup==1.3.0
+sympy==1.14.0
+aiohttp-cors==0.8.1
+soupsieve==2.8
+Farama-Notifications==0.0.4
+numpydantic==1.6.7
+uvicorn==0.38.0
+waterbear==2.6.8
+nvidia-cudnn-cu12==9.10.2.21
+transformers==4.44.2
+cmake==4.2.3
+xxhash==3.5.0
+annotated-doc==0.0.4
+jsonlines==4.0.0
+nvidia-cuda-nvrtc-cu12==12.8.93
+pydantic==2.10.6
+triton==3.4.0
+nvidia-cufft-cu12==11.3.3.83
+multidict==6.6.4
+setuptools==82.0.1
+shtab==1.7.2
+pycollada==0.9.2
+beautifulsoup4==4.14.2
+msgspec==0.19.0
+huggingface-hub==0.35.3
+pydantic_core==2.27.2
+iniconfig==2.3.0
+zarr==2.18.3
+pytz==2025.2
+attrs==25.3.0
+requests==2.32.5
+hf_transfer==0.1.9
+numba==0.64.0
+einx==0.3.0
+scipy==1.15.3
+transforms3d==0.4.2
+pyzmq==27.1.0
+aiohappyeyeballs==2.6.1
+pymunk==7.2.0
+six==1.17.0
+expandvars==1.1.2
+prompt_toolkit==3.0.52
+wcwidth==0.6.0
+tomli==2.4.0
+ruamel.yaml.clib==0.2.14
+multiprocess==0.70.16
+vhacdx==0.0.9
+nvidia-cusparse-cu12==12.5.8.93
+aiosignal==1.4.0
+itsdangerous==2.2.0
+av==17.0.0
+nvidia-nccl-cu12==2.27.3
+httpx==0.28.1
+asciitree==0.3.3
+platformdirs==4.4.0
+sentry-sdk==2.39.0
+draccus==0.11.5
+nvidia-curand-cu12==10.3.9.90
+plotly==6.2.0
+jsonschema==4.25.1
+fastapi==0.119.1
+nvidia-nvjitlink-cu12==12.8.93
+fsspec==2025.3.0
+MarkupSafe==3.0.3
+pydantic-yaml==1.6.0
+h11==0.16.0
+typer==0.24.1
+mypy_extensions==1.1.0
+pytest==9.0.2
+h5py==3.14.0
+python-xlib==0.33
+lazy_loader==0.4
+einops==0.8.1
+albumentations==1.4.18
+params_proto==2.13.2
+fasteners==0.20
+psutil==7.1.0
+starlette==0.48.0
+anyio==4.11.0
+gdown==5.2.0
+charset-normalizer==3.4.3
+tyro==0.9.32
+filelock==3.19.1
+websockets==15.0.1
+accelerate==1.13.0
+python-dotenv==1.2.1
+orderly-set==5.5.0
+inquirerpy==0.3.4
+urllib3==2.5.0
+PyYAML==6.0.3
+rerun-sdk==0.23.1
+antlr4-python3-runtime==4.9.3
+mdurl==0.1.2
+omegaconf==2.3.0
+referencing==0.37.0
+pycparser==3.0
+pluggy==1.6.0
+torchvision==0.23.0
+docstring_parser==0.17.0
+wandb==0.25.1
+numpy==1.26.4
+GitPython==3.1.45
+opencv-python-headless==4.11.0.86
+cffi==2.0.0
+yourdfpy==0.0.58
+async-timeout==4.0.3
+shapely==2.1.2
+frozenlist==1.7.0
+simplejpeg==1.9.0
+nvidia-cuda-cupti-cu12==12.8.90
+Pygments==2.19.2
+rtree==1.4.1
+gitdb==4.0.12
+colorlog==6.10.1
+Werkzeug==3.1.6
+zipp==3.23.0
+albucore==0.0.17
+imageio==2.34.2
+frozendict==2.4.6
+jsonschema-specifications==2025.9.1
+rpds-py==0.28.0
+tokenizers==0.19.1
+blinker==1.9.0
+argparse==1.4.0
+nvidia-nvtx-cu12==12.8.90
+msgpack==1.1.1
+smmap==5.0.2
+packaging==25.0
+embreex==2.17.7.post7
+cloudpickle==3.1.2
+vuer==0.0.68
+propcache==0.3.2
+torchaudio==2.8.0
+pfzy==0.3.4
+dm-tree==0.1.8
+nvidia-cuda-runtime-cu12==12.8.90
+datasets==3.6.0
+numcodecs==0.13.1
+sniffio==1.3.1
+Jinja2==3.1.6
+narwhals==2.6.0
+gymnasium==0.29.1
+yarl==1.20.1
+typeguard==4.4.4
+termcolor==3.1.0
+importlib_metadata==8.7.1
+eval_type_backport==0.2.2
+certifi==2025.8.3
+tzdata==2025.2
+typing_extensions==4.15.0
+viser==1.0.15
+typing-inspect==0.9.0
+torch==2.8.0
+annotated-types==0.7.0
+svg.path==7.0
+mergedeep==1.3.4
+psi==0.0.0
+deepdiff==8.6.1
+nvidia-cufile-cu12==1.13.1.3
+toml==0.10.2
+click==8.3.0
+diffusers==0.30.2
+dotenv==0.9.9
+trimesh==4.8.3
+nvidia-cusparselt-cu12==0.7.1
+pyyaml-include==1.4.1
+scikit-image==0.25.2
+PySocks==1.7.1
+aiohttp==3.10.5
+regex==2026.2.28
+opencv-python==4.11.0.86
+nodeenv==1.9.1
+torchcodec==0.6.0
+protobuf==6.33.2
+pillow==11.3.0
+nvidia-cusolver-cu12==11.7.3.90
+idna==3.10
+Flask==3.1.3
+lerobot==0.1.0
+safetensors==0.7.0
+killport==1.2.0
+hf-xet==1.1.10
+nvidia-cublas-cu12==12.8.4.1
+imageio-ffmpeg==0.6.0
+httpcore==1.0.9
+networkx==3.4.2
+ruamel.yaml==0.18.15
+manifold3d==3.2.1
+shellingham==1.5.4
+mapbox_earcut==1.0.3
+pyarrow==21.0.0
+dill==0.3.8
+markdown-it-py==4.0.0
+tqdm==4.67.1
+argcomplete==3.6.2
+pandas==2.3.3
+lxml==6.0.2
+python-dateutil==2.9.0.post0
+evdev==1.9.3
+rich==14.1.0
+psi==0.0.0

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,129 @@

+{
+  "os": "Linux-6.8.0-106-generic-x86_64-with-glibc2.39",
+  "python": "CPython 3.10.20",
+  "startedAt": "2026-04-10T02:05:01.005456Z",
+  "args": [
+    "simple_dp_config",
+    "--seed=2026",
+    "--exp=g1wholebodyhandover-v0",
+    "--train.name=diffusion-policy-g1",
+    "--log.report-to=wandb",
+    "--train.data_parallel=ddp",
+    "--train.mixed_precision=bf16",
+    "--train.train-batch-size=32",
+    "--train.warmup-steps=1000",
+    "--train.warmup-ratio=None",
+    "--train.checkpointing-steps=5000",
+    "--train.validation_steps=500",
+    "--train.val_num_batches=20",
+    "--train.gradient_accumulation_steps=1",
+    "--train.max-training-steps=40000",
+    "--train.learning-rate=1e-4",
+    "--train.max-grad-norm=1.0",
+    "--train.lr_scheduler_kwargs.weight_decay=1e-6",
+    "--train.lr_scheduler_kwargs.betas",
+    "0.95",
+    "0.999",
+    "--train.lr_scheduler_type=cosine",
+    "--data.root_dir=/data/jliu/data",
+    "--data.train-repo-ids=G1WholebodyHandover-v0",
+    "--data.transform.repack.action_chunk_size=16",
+    "--data.transform.repack.pad-action-dim=36",
+    "--data.transform.repack.pad-state-dim=36",
+    "--data.transform.field.stat-path=meta/stats_psi0.json",
+    "--data.transform.field.stat-action-key=action",
+    "--data.transform.field.stat-state-key=states",
+    "--data.transform.field.normalize-state",
+    "--data.transform.field.action-norm-type=bounds",
+    "--data.transform.field.pad-action-dim=36",
+    "--data.transform.field.pad-state-dim=36",
+    "--data.transform.model.img-aug",
+    "--model.action-chunk-size=16",
+    "--model.action-dim=36",
+    "--model.obs-dim=36"
+  ],
+  "program": "/data/jliu/psi/scripts/train.py",
+  "codePath": "scripts/train.py",
+  "codePathLocal": "scripts/train.py",
+  "git": {
+    "remote": "https://github.com/songlin/psi.git",
+    "commit": "04614628ecb677f5f278e2d31c1103aed8127f26"
+  },
+  "email": "jliu530@163.com",
+  "root": "/data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204",
+  "host": "nebula99",
+  "executable": "/data/jliu/psi/.venv-dp/bin/python3",
+  "cpu_count": 128,
+  "cpu_count_logical": 128,
+  "gpu": "NVIDIA A100-SXM4-80GB",
+  "gpu_count": 8,
+  "disk": {
+    "/": {
+      "total": "105089261568",
+      "used": "82290688000"
+    }
+  },
+  "memory": {
+    "total": "1623177445376"
+  },
+  "gpu_nvidia": [
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-02b51758-2aec-8c71-c751-92567fdb15ad"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-be645bb4-1ef0-15da-fc6b-53c5378650df"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-44868ccd-5809-61e2-f8cc-1dff8efc7eb1"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-a12b8de3-fb12-2901-c3a2-1e0e2b050b7b"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-57787183-4904-b2c9-cf52-1c1af976b365"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-e82d0fd0-9dcb-3d7c-9451-c4770ad6ddc3"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-9a825fa3-60d0-3acf-6c79-67e9230ae24c"
+    },
+    {
+      "name": "NVIDIA A100-SXM4-80GB",
+      "memoryTotal": "85899345920",
+      "cudaCores": 6912,
+      "architecture": "Ampere",
+      "uuid": "GPU-6fe02e5e-b886-9c02-e433-6237f3897dd8"
+    }
+  ],
+  "cudaVersion": "12.9",
+  "writerId": "6ptlrch3t1wewxljiv5hkmtr0grgv5w6"
+}

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"val/denorm_err_l1_rpy":0.004311066120862961,"val/denorm_err_l1_hand_joints":0.2085319459438324,"val/denorm_err_l1_torso_vx":0.0048075346276164055,"_timestamp":1.7757987454488413e+09,"_runtime":12045.173678753,"train/epoch":112,"val/denorm_err_l1_torso_vy":0.003890593070536852,"train/loss":0.0026351141277700663,"val/denorm_err_l1_height":0,"_step":40000,"val/bc_loss":0.0043721916154026985,"val/denorm_err_l1_arm_joints":0.027254171669483185,"_wandb":{"runtime":12045},"val/denorm_err_l1_torso_target_yaw":0.0004649795009754598,"val/denorm_err_l1_torso_vyaw":0.004365503787994385}

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug-core.log ADDED Viewed

	@@ -0,0 +1,19 @@

+{"time":"2026-04-10T02:05:01.084000894Z","level":"INFO","msg":"main: starting server","port-filename":"/tmp/tmprpqrafn8/port-1404689.txt","pid":1404689,"log-level":0,"disable-analytics":false,"shutdown-on-parent-exit":false,"enable-dcgm-profiling":false}
+{"time":"2026-04-10T02:05:01.08475924Z","level":"INFO","msg":"server: will exit if parent process dies","ppid":1404689}
+{"time":"2026-04-10T02:05:01.08470711Z","level":"INFO","msg":"server: accepting connections","addr":{"Name":"/tmp/wandb-1404689-1607107-1367746566/socket","Net":"unix"}}
+{"time":"2026-04-10T02:05:01.256956327Z","level":"INFO","msg":"connection: ManageConnectionData: new connection created","id":"1(@)"}
+{"time":"2026-04-10T02:05:01.267618045Z","level":"INFO","msg":"handleInformInit: received","streamId":"sjem5sh4","id":"1(@)"}
+{"time":"2026-04-10T02:05:01.59035368Z","level":"INFO","msg":"handleInformInit: stream started","streamId":"sjem5sh4","id":"1(@)"}
+{"time":"2026-04-10T02:05:07.330804152Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"1v3sozvmfc6a"}
+{"time":"2026-04-10T05:25:47.35681973Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"1v3sozvmfc6a"}
+{"time":"2026-04-10T05:25:48.207051511Z","level":"INFO","msg":"connection: cancelling request","id":"1(@)","requestId":"1v3sozvmfc6a"}
+{"time":"2026-04-10T05:25:48.207779707Z","level":"INFO","msg":"handleInformFinish: finish message received","streamId":"sjem5sh4","id":"1(@)"}
+{"time":"2026-04-10T05:25:48.208265471Z","level":"INFO","msg":"handleInformFinish: stream closed","streamId":"sjem5sh4","id":"1(@)"}
+{"time":"2026-04-10T05:26:48.572037497Z","level":"INFO","msg":"handleInformTeardown: server teardown initiated","id":"1(@)"}
+{"time":"2026-04-10T05:26:48.572102657Z","level":"INFO","msg":"handleInformTeardown: server shutdown complete","id":"1(@)"}
+{"time":"2026-04-10T05:26:48.572112678Z","level":"INFO","msg":"server is shutting down"}
+{"time":"2026-04-10T05:26:48.572164568Z","level":"INFO","msg":"connection: closing","id":"1(@)"}
+{"time":"2026-04-10T05:26:48.572199678Z","level":"INFO","msg":"server: listener closed","addr":{"Name":"/tmp/wandb-1404689-1607107-1367746566/socket","Net":"unix"}}
+{"time":"2026-04-10T05:26:48.572300229Z","level":"INFO","msg":"connection: closed successfully","id":"1(@)"}
+{"time":"2026-04-10T05:26:48.57232799Z","level":"INFO","msg":"connection: ManageConnectionData: connection closed","id":"1(@)"}
+{"time":"2026-04-10T05:26:48.57234687Z","level":"INFO","msg":"server is closed"}

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug-internal.log ADDED Viewed

The diff for this file is too large to render. See raw diff

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug.log ADDED Viewed

	@@ -0,0 +1,25 @@

+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_setup.py:_flush():81] Current SDK version is 0.25.1
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_setup.py:_flush():81] Configure stats pid to 1404689
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_setup.py:_flush():81] Loading settings from environment variables
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:setup_run_log_directory():717] Logging user logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug.log
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:setup_run_log_directory():718] Logging internal logs to /data/jliu/psi/.runs/diffusion-policy-g1/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/logs/debug-internal.log
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:init():844] calling init triggers
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:init():849] wandb.init called with sweep_config: {}
+config: {'_wandb': {}}
+2026-04-10 02:05:01,007 INFO    MainThread:1404689 [wandb_init.py:init():892] starting backend
+2026-04-10 02:05:01,257 INFO    MainThread:1404689 [wandb_init.py:init():895] sending inform_init request
+2026-04-10 02:05:01,265 INFO    MainThread:1404689 [wandb_init.py:init():903] backend started and connected
+2026-04-10 02:05:01,266 INFO    MainThread:1404689 [wandb_init.py:init():973] updated telemetry
+2026-04-10 02:05:01,272 INFO    MainThread:1404689 [wandb_init.py:init():997] communicating run to backend with 90.0 second timeout
+2026-04-10 02:05:02,182 INFO    MainThread:1404689 [wandb_init.py:init():1042] starting run threads in backend
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_console_start():2524] atexit reg
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_redirect():2373] redirect: wrap_raw
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_redirect():2442] Wrapping output streams.
+2026-04-10 02:05:02,323 INFO    MainThread:1404689 [wandb_run.py:_redirect():2465] Redirects installed.
+2026-04-10 02:05:02,328 INFO    MainThread:1404689 [wandb_init.py:init():1082] run started, returning control to user process
+2026-04-10 02:05:02,329 INFO    MainThread:1404689 [wandb_run.py:_config_callback():1403] config_cb None None {'exp': 'g1wholebodyhandover-v0', 'seed': 2026, 'auto_tag_run': False, 'eval': False, 'debug': False, 'timestamp': '2604100204', 'log': {'logging_dir': 'logs', 'report_to': 'wandb', 'log_freq': 100}, 'wandb': {'project': 'psi', 'entity': 'jliu530-soochow-university', 'group': None, 'id': None, 'name': None, 'resume': 'allow'}, 'train': {'num_workers': 8, 'overfit_single_batch': False, 'name': 'diffusion-policy-g1', 'resume_from_checkpoint': None, 'skip_resumed_steps': False, 'hf_token': '.hf_token', 'lora': False, 'output_dir': '.runs', 'gradient_accumulation_steps': 1, 'mixed_precision': 'bf16', 'max_grad_norm': 1.0, 'optimizer_foreach': None, 'train_batch_size': 32, 'val_batch_size': 16, 'val_num_batches': 20, 'checkpointing_steps': 5000, 'max_checkpoints_to_keep': None, 'validation_steps': 500, 'learning_rate': 0.0001, 'lr_scheduler_type': 'cosine', 'lr_scheduler_kwargs': {'betas': [0.95, 0.999], 'weight_decay': 1e-06, 'eps': 1e-08}, 'scheduler_specific_kwargs': {}, 'data_parallel': 'ddp', 'sharding_strategy': 'full-shard', 'deepspeed_config': '/data/jliu/psi/src/InternVLA/config/deepseeds/zero3.json', 'enable_gradient_checkpointing': True, 'enable_mixed_precision_training': True, 'reduce_in_full_precision': True, 'max_training_steps': 40000, 'num_train_epochs': None, 'warmup_steps': 1000, 'warmup_ratio': None}, 'data': {'transform': {'repack': {'dataset_name': 'simple', 'num_past_frames': 0, 'action_chunk_size': 16, 'pad_action_dim': 36, 'pad_state_dim': 36}, 'model': {'resize': {'size': [256, 480]}, 'color_jitter': {'brightness': 0.2, 'contrast': [0.8, 1.2], 'saturation': [0.8, 1.2], 'hue': 0.05}, 'center_crop': {'size': [224, 224]}, 'normalize': {'mean': [0.485, 0.456, 0.406], 'std': [0.229, 0.224, 0.225]}, 'img_aug': True}, 'field': {'stat_path': 'meta/stats_psi0.json', 'action_norm_type': 'bounds', 'stat_action_key': 'action', 'stat_state_key': 'states', 'use_norm_mask': False, 'action_norm_masks': [True, True, True, True, True, True, False], 'action_min': [-0.5, -1.1095792134107943e-16, -1.1095792134107943e-16, -1.5, -1.5, -1.5, -1.5, -0.5, -0.699999988079071, -0.699999988079071, -2.2166350627321588e-16, -2.2166350627321588e-16, 0.0, -2.2166350627321588e-16, -0.47567468881607056, 0.1900009959936142, -0.512170135974884, -0.6265152096748352, -0.5008617043495178, -0.8220608830451965, -0.9223371148109436, -0.49507391452789307, -0.3437551259994507, -0.6871383190155029, -0.7637607455253601, -0.7568023204803467, -0.576077401638031, -0.4588268995285034, -0.13876836001873016, -0.10360867530107498, -0.47856518626213074, 0.7400000095367432, -0.5, -0.5, -0.26161932945251465, -0.06718750298023224], 'action_max': [0.5, 0.699999988079071, 0.699999988079071, 0.0, 2.2146225653890418e-16, 2.2146225653890418e-16, 2.2146225653890418e-16, 1.2266071310501902e-19, 1.1078670818917075e-16, 1.1078670818917075e-16, 1.5, 1.5, 0.6000000238418579, 1.5, 0.2472410947084427, 0.7092280983924866, 1.2571598291397095, 0.42311304807662964, 0.8564174771308899, 0.5002086162567139, 0.5172277092933655, 0.16140148043632507, -0.1900009959936142, 0.5362864136695862, 0.5715147256851196, 0.5002322196960449, 0.566592276096344, 0.6392397880554199, 0.1580466777086258, 0.2233395129442215, 0.2582152187824249, 0.7400000095367432, 0.5, 0.5, 0.3454970121383667, 0.2899305522441864], 'state_min': [-0.5564982891082764, -0.48307520151138306, -0.0005447770818136632, -0.8388738632202148, -1.3970016241073608, -0.8296014666557312, -1.4599460363388062, -0.5806806683540344, -0.5149835348129272, -0.6775947213172913, -0.001480442238971591, -0.0002713006397243589, -0.000914653530344367, -0.00019419840828049928, -0.4206617772579193, 0.13972464203834534, -0.546251654624939, -0.5596316456794739, -0.4764360189437866, -0.7253566384315491, -0.9443663954734802, -0.4381798803806305, -0.3338131606578827, -0.667724072933197, -0.6881827116012573, -0.7544379830360413, -0.5189417600631714, -0.4484957158565521, -0.13709338009357452, -0.07360810041427612, -0.4748336970806122, 0.7400000095367432, 0.0, 0.0, 0.0, 0.0], 'state_max': [0.43566983938217163, 0.3739710748195648, 0.6575677990913391, 0.004060761071741581, 0.0005700877518393099, 0.0004725759499706328, 0.00010080631182063371, 1.310737025050912e-05, 0.21882089972496033, 0.0005271440604701638, 0.530737042427063, 1.4406861066818237, 1.4605127573013306, 1.4595911502838135, 0.2663630545139313, 0.657910943031311, 1.2515853643417358, 0.502498209476471, 0.8292973637580872, 0.5248894095420837, 0.4653257131576538, 0.18638382852077484, -0.16696421802043915, 0.49318820238113403, 0.6363148093223572, 0.45773962140083313, 0.6238265037536621, 0.653800904750824, 0.1436084657907486, 0.25937986373901367, 0.26422709226608276, 0.7400000095367432, 0.0, 0.0, 0.0, 0.0], 'normalize_state': True, 'pad_action_dim': 36, 'pad_state_dim': 36}}, 'root_dir': '/data/jliu/data', 'train_repo_ids': ['G1WholebodyHandover-v0'], 'val_repo_ids': ['G1WholebodyHandover-v0']}, 'model': {'num_diffusion_iters': 100, 'action_chunk_size': 16, 'num_cameras': 1, 'share_vision_encoder': False, 'obs_horizon': 1, 'action_exec_horizon': 6, 'action_dim': 36, 'obs_dim': 36}, 'environment_variables': {'OMP_NUM_THREADS': '32', 'HF_HOME': '/data/cache', 'TORCH_HOME': '/data/cache', 'HF_TOKEN': 'hf_...TiKa', 'HF_LEROBOT_HOME': '/data/data/lerobot', 'WE_HOME': 'Not Set', 'DATA_HOME': '/data/data', 'UV_CACHE_DIR': '/data/cache', 'WANDB_API_KEY': '90e...5c06', 'PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION': 'python', 'CUDA_VISIBLE_DEVICES': '4,5,6,7', 'WORLD_SIZE': '4', 'LOCAL_WORLD_SIZE': '4', 'RANK': '0', 'LOCAL_RANK': '0', 'MASTER_ADDR': 'nebula99', 'MASTER_PORT': '38477'}}
+2026-04-10 05:25:47,354 INFO    MainThread:1404689 [wandb_run.py:_finish():2291] finishing run jliu530-soochow-university/psi/sjem5sh4
+2026-04-10 05:25:47,355 INFO    MainThread:1404689 [wandb_run.py:_atexit_cleanup():2490] got exitcode: 0
+2026-04-10 05:25:47,356 INFO    MainThread:1404689 [wandb_run.py:_restore():2472] restore
+2026-04-10 05:25:47,356 INFO    MainThread:1404689 [wandb_run.py:_restore():2478] restore done
+2026-04-10 05:25:48,206 INFO    MainThread:1404689 [wandb_run.py:_footer_sync_info():3868] logging synced files

dp/diffusion-policy-g1-sim/g1wholebodyhandover-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604100204/wandb/run-20260410_020501-sjem5sh4/run-sjem5sh4.wandb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bda83724181dddc3ec942bb2e4ae2ea91b04643e977a2bb1e62357e2878d28f6
+size 36695569

dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/argv.txt ADDED Viewed

	@@ -0,0 +1,37 @@

+scripts/train.py
+simple_dp_config
+--seed=2026
+--exp=g1wholebodylocomotionpickbetweentablesteleop-v0
+--train.name=diffusion-policy-g1
+--log.report-to=wandb
+--train.data_parallel=ddp
+--train.mixed_precision=bf16
+--train.train-batch-size=32
+--train.warmup-steps=1000
+--train.warmup-ratio=None
+--train.checkpointing-steps=5000
+--train.validation_steps=500
+--train.val_num_batches=20
+--train.gradient_accumulation_steps=1
+--train.max-training-steps=40000
+--train.learning-rate=1e-4
+--train.max-grad-norm=1.0
+--train.lr_scheduler_kwargs.weight_decay=1e-6
+--train.lr_scheduler_kwargs.betas 0.95 0.999
+--train.lr_scheduler_type=cosine
+--data.root_dir=/data/jliu/data
+--data.train-repo-ids=G1WholebodyLocomotionPickBetweenTablesTeleop-v0
+--data.transform.repack.action_chunk_size=16
+--data.transform.repack.pad-action-dim=36
+--data.transform.repack.pad-state-dim=36
+--data.transform.field.stat-path=meta/stats_psi0.json
+--data.transform.field.stat-action-key=action
+--data.transform.field.stat-state-key=states
+--data.transform.field.normalize-state
+--data.transform.field.action-norm-type=bounds
+--data.transform.field.pad-action-dim=36
+--data.transform.field.pad-state-dim=36
+--data.transform.model.img-aug
+--model.action-chunk-size=16
+--model.action-dim=36
+--model.obs-dim=36

dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/ema_net.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ae7cb6d75cb6937356f77cab48db617379d3a6c8ef61300bd9d1b2ad7e8c4640
+size 337302879

dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7b66c50b14c3bc9035cc256ccce61b77be6386ed4c668b260b59139adfddb26d
+size 337238328

dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/optimizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:de5d8ac0c1349b326c1f3a01e11f8d1f6961def58962424b014b50e510554296
+size 674602251

dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/random_states_0.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e4affa92a6082563f121a744b3e33daacbb1669423413eeaba7ad196031f397
+size 15473

dp/diffusion-policy-g1-sim/g1wholebodylocomotionpickbetweentablesteleop-v0.g1.cosine.lr1.0e-04.b128.gpus4.2604081550/checkpoints/ckpt_40000/random_states_1.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:655a5decc24cfd238cd0339b5b106cef192a7e3e4988ec6be31ff16df8528fcc
+size 15473