diff --git "a/Order_Ablations/E115/train.rank0.log" "b/Order_Ablations/E115/train.rank0.log"
new file mode 100644--- /dev/null
+++ "b/Order_Ablations/E115/train.rank0.log"
@@ -0,0 +1,1259 @@
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+W0127 17:48:37.253000 200820 torch/distributed/run.py:803] 
+W0127 17:48:37.253000 200820 torch/distributed/run.py:803] *****************************************
+W0127 17:48:37.253000 200820 torch/distributed/run.py:803] Setting OMP_NUM_THREADS environment variable for each process to be 1 in default, to avoid your system being overloaded, please further tune the variable for optimal performance in your application as needed. 
+W0127 17:48:37.253000 200820 torch/distributed/run.py:803] *****************************************
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+/usr/local/lib/python3.12/dist-packages/torch/cuda/__init__.py:63: FutureWarning: The pynvml package is deprecated. Please install nvidia-ml-py instead. If you did not install pynvml directly, please report this to the maintainers of the package that installed pynvml for you.
+  import pynvml  # type: ignore[import]
+Trainer._get_train_sampler replaced with custom implementation.
+[2026-01-27 17:48:44,068] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+Trainer._get_train_sampler replaced with custom implementation.
+Trainer._get_train_sampler replaced with custom implementation.
+[2026-01-27 17:48:44,922] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+Trainer._get_train_sampler replaced with custom implementation.
+Trainer._get_train_sampler replaced with custom implementation.
+Trainer._get_train_sampler replaced with custom implementation.
+[2026-01-27 17:48:44,999] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[2026-01-27 17:48:45,050] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[2026-01-27 17:48:45,062] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[2026-01-27 17:48:45,066] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+Trainer._get_train_sampler replaced with custom implementation.
+Trainer._get_train_sampler replaced with custom implementation.
+[2026-01-27 17:48:45,176] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[2026-01-27 17:48:45,186] [INFO] [real_accelerator.py:222:get_accelerator] Setting ds_accelerator to cuda (auto detect)
+[2026-01-27 17:48:45,274] [INFO] [comm.py:658:init_distributed] cdb=None
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+[2026-01-27 17:48:46,054] [INFO] [comm.py:658:init_distributed] cdb=None
+[2026-01-27 17:48:46,072] [INFO] [comm.py:658:init_distributed] cdb=None
+[2026-01-27 17:48:46,115] [INFO] [comm.py:658:init_distributed] cdb=None
+[2026-01-27 17:48:46,207] [INFO] [comm.py:658:init_distributed] cdb=None
+[2026-01-27 17:48:46,229] [INFO] [comm.py:658:init_distributed] cdb=None
+[2026-01-27 17:48:46,243] [INFO] [comm.py:658:init_distributed] cdb=None
+[2026-01-27 17:48:46,244] [INFO] [comm.py:658:init_distributed] cdb=None
+[2026-01-27 17:48:46,244] [INFO] [comm.py:689:init_distributed] Initializing TorchBackend in DeepSpeed with backend nccl
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+Warning: FlashAttention 3 is not available, falling back to PyTorch's scaled_dot_product_attention
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
+Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.09s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.09s/it]
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.06s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.06s/it]
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.05s/it]15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gLoading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.05s/it]amma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.05s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.05s/it]
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.05s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.05s/it]
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.06s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.06s/it]
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.04s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.04s/it]
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.08s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:02<00:00,  1.08s/it]
+Some weights of Qwen2_5_VLForConditionalGenerationWithVGGT were not initialized from the model checkpoint at Qwen/Qwen2.5-VL-3B-Instruct and are newly initialized: ['geometry_encoder.vggt.aggregator.camera_token', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.frame_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.k_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.q_norm.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.global_blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.0.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.1.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.10.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.11.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.12.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.13.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.14.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.15.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.16.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.17.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.18.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.19.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.2.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.20.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.21.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.22.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.23.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.3.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.4.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.5.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.6.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.7.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.8.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.attn.qkv.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls1.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.ls2.gamma', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.mlp.fc2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm1.weight', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.bias', 'geometry_encoder.vggt.aggregator.patch_embed.blocks.9.norm2.weight', 'geometry_encoder.vggt.aggregator.patch_embed.cls_token', 'geometry_encoder.vggt.aggregator.patch_embed.mask_token', 'geometry_encoder.vggt.aggregator.patch_embed.norm.bias', 'geometry_encoder.vggt.aggregator.patch_embed.norm.weight', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.bias', 'geometry_encoder.vggt.aggregator.patch_embed.patch_embed.proj.weight', 'geometry_encoder.vggt.aggregator.patch_embed.pos_embed', 'geometry_encoder.vggt.aggregator.patch_embed.register_tokens', 'geometry_encoder.vggt.aggregator.register_token', 'language_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'language_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'language_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.0.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.1.0.geo_mlp.2.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_ln.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.0.weight', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.bias', 'multi_layer_feature_fusion.fusion_layers.2.0.geo_mlp.2.weight']
+You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Using a slow image processor as `use_fast` is unset and a slow processor was saved with this model. `use_fast=True` will be the default behavior in v4.50, even if the model was saved with a slow processor. This will result in minor differences in outputs. You'll still be able to use a slow processor with `use_fast=False`.
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+Vision Module - Attention Blocks:
+Trainable Block Indices: None
+Non-Trainable Block Indices: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31]
+Merger Module Trainable: False
+LLM Module - Embed Tokens Trainable: True
+LLM Module - Trainable Layer Indices: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35]
+LLM Module - Non-Trainable Layer Indices: None
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+Qwen2_5_VLConfig {
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen2_5_VLForConditionalGeneration"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "feature_fusion_method": "deepstack_language_add",
+  "fusion_num_layers": 1,
+  "geometry_encoder_layers": [
+    11,
+    17,
+    23
+  ],
+  "geometry_encoder_type": "vggt",
+  "geometry_fusion_layers": [
+    0,
+    1,
+    2
+  ],
+  "geometry_merger_type": "mlp",
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "image_token_id": 151655,
+  "include_camera_token": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 128000,
+  "max_window_layers": 70,
+  "model_type": "qwen2_5_vl",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 36,
+  "num_key_value_heads": 2,
+  "pos_encoding_type": "none",
+  "reference_frame": "first",
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "mrope_section": [
+      16,
+      24,
+      24
+    ],
+    "rope_type": "default",
+    "type": "default"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.50.0",
+  "use_cache": false,
+  "use_geometry_encoder": true,
+  "use_sliding_window": false,
+  "video_token_id": 151656,
+  "vision_config": {
+    "depth": 32,
+    "fullatt_block_indexes": [
+      7,
+      15,
+      23,
+      31
+    ],
+    "hidden_act": "silu",
+    "hidden_size": 1280,
+    "in_channels": 3,
+    "in_chans": 3,
+    "intermediate_size": 3420,
+    "model_type": "qwen2_5_vl",
+    "num_heads": 16,
+    "out_hidden_size": 2048,
+    "patch_size": 14,
+    "spatial_merge_size": 2,
+    "spatial_patch_size": 14,
+    "temporal_patch_size": 2,
+    "tokens_per_second": 2,
+    "torch_dtype": "bfloat16",
+    "window_size": 112
+  },
+  "vision_end_token_id": 151653,
+  "vision_language_fusion_layers": null,
+  "vision_start_token_id": 151652,
+  "vision_token_id": 151654,
+  "vocab_size": 151936
+}
+
+Loading datasets: [{'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}, {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}, {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}, {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}]
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+Formatting inputs...Skip in lazy mode
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 140566 examples from dataset {'annotation_path': 'data/train/spar_234k.json', 'data_path': 'data/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'spar_234k'}
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 38250 examples from dataset {'annotation_path': 'data/train/llava_hound_64k.json', 'data_path': 'data/media', 'tag': '2d', 'sampling_rate': 0.6, 'dataset_name': 'llava_hound_64k'}
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+Formatting inputs...Skip in lazy mode
+Formatting inputs...Skip in lazy mode
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+Formatting inputs...Skip in lazy mode
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+Formatting inputs...Skip in lazy mode
+Formatting inputs...Skip in lazy mode
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+Formatting inputs...Skip in lazy mode
+sampling 31067 examples from dataset {'annotation_path': 'data/vlm3r/annotations/vsibench_train/merged_qa_scannet_train.json', 'data_path': 'data/vlm3r/media', 'tag': '3d', 'sampling_rate': 0.6, 'dataset_name': 'vlm3r_scannet'}
+sampling 1909 examples from dataset {'annotation_path': 'data/vsi_590k/annotations/vsi_appearance_order_vsibench_scannet.json', 'data_path': 'data/vsi_590k/media', 'tag': '3d', 'sampling_rate': 0.5, 'dataset_name': 'vsi_appr_order'}
+Total training samples: 211792
+Formatting inputs...Skip in lazy mode
+  0%|          | 0/3309 [00:00<?, ?it/s]/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+  0%|          | 1/3309 [00:22<20:41:17, 22.51s/it]  0%|          | 2/3309 [00:39<17:38:19, 19.20s/it]  0%|          | 3/3309 [00:54<15:44:22, 17.14s/it]  0%|          | 4/3309 [01:08<14:47:05, 16.10s/it]  0%|          | 5/3309 [01:24<14:48:39, 16.14s/it]  0%|          | 6/3309 [01:38<14:11:54, 15.48s/it]  0%|          | 7/3309 [01:55<14:26:52, 15.75s/it]  0%|          | 8/3309 [02:11<14:42:30, 16.04s/it]  0%|          | 9/3309 [02:26<14:13:27, 15.52s/it]  0%|          | 10/3309 [02:42<14:26:35, 15.76s/it]                                                    {'loss': 13.8334, 'grad_norm': 166.1145477294922, 'learning_rate': 1.0000000000000002e-06, 'epoch': 0.0}
+  0%|          | 10/3309 [02:42<14:26:35, 15.76s/it]  0%|          | 11/3309 [02:57<14:04:37, 15.37s/it]  0%|          | 12/3309 [03:11<13:50:05, 15.11s/it]  0%|          | 13/3309 [03:27<14:09:37, 15.47s/it]  0%|          | 14/3309 [03:42<13:50:50, 15.13s/it]  0%|          | 15/3309 [03:56<13:35:53, 14.86s/it]  0%|          | 16/3309 [04:10<13:24:29, 14.66s/it]  1%|          | 17/3309 [04:24<13:15:55, 14.51s/it]  1%|          | 18/3309 [04:39<13:12:34, 14.45s/it]  1%|          | 19/3309 [04:53<13:08:59, 14.39s/it]  1%|          | 20/3309 [05:07<13:05:54, 14.34s/it]                                                    {'loss': 13.1022, 'grad_norm': 81.33020782470703, 'learning_rate': 2.0000000000000003e-06, 'epoch': 0.01}
+  1%|          | 20/3309 [05:07<13:05:54, 14.34s/it]  1%|          | 21/3309 [05:23<13:38:10, 14.93s/it]  1%|          | 22/3309 [05:40<13:59:17, 15.32s/it]  1%|          | 23/3309 [05:54<13:44:33, 15.06s/it]  1%|          | 24/3309 [06:09<13:36:52, 14.92s/it]  1%|          | 25/3309 [06:23<13:24:43, 14.70s/it]  1%|          | 26/3309 [06:39<13:50:49, 15.18s/it]  1%|          | 27/3309 [06:53<13:35:27, 14.91s/it]  1%|          | 28/3309 [07:10<13:58:59, 15.34s/it]  1%|          | 29/3309 [07:26<14:14:35, 15.63s/it]  1%|          | 30/3309 [07:43<14:29:10, 15.90s/it]                                                    {'loss': 12.0899, 'grad_norm': 51.09122085571289, 'learning_rate': 3e-06, 'epoch': 0.01}
+  1%|          | 30/3309 [07:43<14:29:10, 15.90s/it]  1%|          | 31/3309 [07:59<14:40:58, 16.13s/it]  1%|          | 32/3309 [08:16<14:43:26, 16.18s/it]  1%|          | 33/3309 [08:32<14:44:47, 16.21s/it]  1%|          | 34/3309 [08:46<14:15:59, 15.68s/it]  1%|          | 35/3309 [09:03<14:27:05, 15.89s/it]  1%|          | 36/3309 [09:19<14:38:40, 16.11s/it]  1%|          | 37/3309 [09:36<14:41:57, 16.17s/it]  1%|          | 38/3309 [09:52<14:39:01, 16.12s/it]  1%|          | 39/3309 [10:08<14:41:10, 16.17s/it]  1%|          | 40/3309 [10:24<14:46:29, 16.27s/it]                                                    {'loss': 10.2942, 'grad_norm': 49.01457214355469, 'learning_rate': 4.000000000000001e-06, 'epoch': 0.01}
+  1%|          | 40/3309 [10:24<14:46:29, 16.27s/it]  1%|          | 41/3309 [10:39<14:16:16, 15.72s/it]  1%|▏         | 42/3309 [10:55<14:27:37, 15.93s/it]  1%|▏         | 43/3309 [11:12<14:34:38, 16.07s/it]  1%|▏         | 44/3309 [11:26<14:08:38, 15.60s/it]  1%|▏         | 45/3309 [11:42<14:16:32, 15.75s/it]  1%|▏         | 46/3309 [11:59<14:38:59, 16.16s/it]  1%|▏         | 47/3309 [12:14<14:07:13, 15.58s/it]  1%|▏         | 48/3309 [12:30<14:19:29, 15.81s/it]  1%|▏         | 49/3309 [12:46<14:26:17, 15.94s/it]  2%|▏         | 50/3309 [13:03<14:43:20, 16.26s/it]                                                    {'loss': 9.538, 'grad_norm': 46.00205612182617, 'learning_rate': 5e-06, 'epoch': 0.02}
+  2%|▏         | 50/3309 [13:03<14:43:20, 16.26s/it]  2%|▏         | 51/3309 [13:18<14:17:12, 15.79s/it]  2%|▏         | 52/3309 [13:34<14:25:27, 15.94s/it]  2%|▏         | 53/3309 [13:49<14:01:52, 15.51s/it]  2%|▏         | 54/3309 [14:03<13:40:39, 15.13s/it]  2%|▏         | 55/3309 [14:17<13:24:40, 14.84s/it]  2%|▏         | 56/3309 [14:34<13:49:07, 15.29s/it]  2%|▏         | 57/3309 [14:50<14:06:13, 15.61s/it]  2%|▏         | 58/3309 [15:06<14:18:24, 15.84s/it]  2%|▏         | 59/3309 [15:23<14:26:26, 16.00s/it]  2%|▏         | 60/3309 [15:39<14:32:43, 16.12s/it]                                                    {'loss': 8.3357, 'grad_norm': 41.61635971069336, 'learning_rate': 6e-06, 'epoch': 0.02}
+  2%|▏         | 60/3309 [15:39<14:32:43, 16.12s/it]  2%|▏         | 61/3309 [15:56<14:41:42, 16.29s/it]  2%|▏         | 62/3309 [16:12<14:43:00, 16.32s/it]  2%|▏         | 63/3309 [16:28<14:42:40, 16.32s/it]  2%|▏         | 64/3309 [16:45<14:43:12, 16.33s/it]  2%|▏         | 65/3309 [17:01<14:48:20, 16.43s/it]  2%|▏         | 66/3309 [17:18<14:47:11, 16.41s/it]  2%|▏         | 67/3309 [17:32<14:11:41, 15.76s/it]  2%|▏         | 68/3309 [17:48<14:14:49, 15.83s/it]  2%|▏         | 69/3309 [18:02<13:47:51, 15.33s/it]  2%|▏         | 70/3309 [18:16<13:25:19, 14.92s/it]                                                    {'loss': 6.9115, 'grad_norm': 31.584325790405273, 'learning_rate': 7e-06, 'epoch': 0.02}
+  2%|▏         | 70/3309 [18:16<13:25:19, 14.92s/it]  2%|▏         | 71/3309 [18:31<13:18:33, 14.80s/it]  2%|▏         | 72/3309 [18:45<13:09:04, 14.63s/it]  2%|▏         | 73/3309 [19:01<13:35:38, 15.12s/it]  2%|▏         | 74/3309 [19:18<13:59:57, 15.58s/it]  2%|▏         | 75/3309 [19:32<13:37:56, 15.18s/it]  2%|▏         | 76/3309 [19:48<13:56:33, 15.53s/it]  2%|▏         | 77/3309 [20:05<14:07:24, 15.73s/it]  2%|▏         | 78/3309 [20:22<14:32:55, 16.21s/it]  2%|▏         | 79/3309 [20:39<14:39:35, 16.34s/it]  2%|▏         | 80/3309 [20:53<14:10:09, 15.80s/it]                                                    {'loss': 6.7596, 'grad_norm': 51.664695739746094, 'learning_rate': 8.000000000000001e-06, 'epoch': 0.02}
+  2%|▏         | 80/3309 [20:53<14:10:09, 15.80s/it]  2%|▏         | 81/3309 [21:09<14:17:45, 15.94s/it]  2%|▏         | 82/3309 [21:26<14:28:13, 16.14s/it]  3%|▎         | 83/3309 [21:43<14:34:01, 16.26s/it]  3%|▎         | 84/3309 [21:57<14:00:18, 15.63s/it]  3%|▎         | 85/3309 [22:11<13:37:51, 15.22s/it]  3%|▎         | 86/3309 [22:25<13:26:31, 15.01s/it]  3%|▎         | 87/3309 [22:40<13:13:06, 14.77s/it]  3%|▎         | 88/3309 [22:56<13:37:42, 15.23s/it]  3%|▎         | 89/3309 [23:11<13:28:43, 15.07s/it]  3%|▎         | 90/3309 [23:25<13:09:42, 14.72s/it]                                                    {'loss': 7.0298, 'grad_norm': 31.014076232910156, 'learning_rate': 9e-06, 'epoch': 0.03}
+  3%|▎         | 90/3309 [23:25<13:09:42, 14.72s/it]  3%|▎         | 91/3309 [23:41<13:38:46, 15.27s/it]  3%|▎         | 92/3309 [23:57<13:54:57, 15.57s/it]  3%|▎         | 93/3309 [24:14<14:05:37, 15.78s/it]  3%|▎         | 94/3309 [24:30<14:15:14, 15.96s/it]  3%|▎         | 95/3309 [24:46<14:20:01, 16.06s/it]  3%|▎         | 96/3309 [25:01<13:58:06, 15.65s/it]  3%|▎         | 97/3309 [25:18<14:14:00, 15.95s/it]  3%|▎         | 98/3309 [25:34<14:25:05, 16.16s/it]  3%|▎         | 99/3309 [25:49<13:53:57, 15.59s/it]  3%|▎         | 100/3309 [26:03<13:37:17, 15.28s/it]                                                     {'loss': 6.7021, 'grad_norm': 37.792179107666016, 'learning_rate': 1e-05, 'epoch': 0.03}
+  3%|▎         | 100/3309 [26:03<13:37:17, 15.28s/it]  3%|▎         | 101/3309 [26:18<13:27:29, 15.10s/it]  3%|▎         | 102/3309 [26:32<13:18:25, 14.94s/it]  3%|▎         | 103/3309 [26:47<13:13:02, 14.84s/it]  3%|▎         | 104/3309 [27:03<13:36:29, 15.29s/it]  3%|▎         | 105/3309 [27:20<13:58:12, 15.70s/it]  3%|▎         | 106/3309 [27:35<13:41:11, 15.38s/it]  3%|▎         | 107/3309 [27:51<13:54:59, 15.65s/it]  3%|▎         | 108/3309 [28:05<13:31:53, 15.22s/it]  3%|▎         | 109/3309 [28:21<13:49:36, 15.56s/it]  3%|▎         | 110/3309 [28:38<14:04:50, 15.85s/it]                                                     {'loss': 7.3545, 'grad_norm': 37.68498611450195, 'learning_rate': 9.999760394462267e-06, 'epoch': 0.03}
+  3%|▎         | 110/3309 [28:38<14:04:50, 15.85s/it]  3%|▎         | 111/3309 [28:53<13:44:19, 15.47s/it]  3%|▎         | 112/3309 [29:09<13:58:19, 15.73s/it]  3%|▎         | 113/3309 [29:23<13:33:10, 15.27s/it]  3%|▎         | 114/3309 [29:38<13:22:53, 15.08s/it]  3%|▎         | 115/3309 [29:52<13:08:41, 14.82s/it]  4%|▎         | 116/3309 [30:06<12:55:13, 14.57s/it]  4%|▎         | 117/3309 [30:22<13:23:15, 15.10s/it]  4%|▎         | 118/3309 [30:37<13:09:52, 14.85s/it]  4%|▎         | 119/3309 [30:53<13:38:17, 15.39s/it]  4%|▎         | 120/3309 [31:08<13:26:58, 15.18s/it]                                                     {'loss': 7.0073, 'grad_norm': 38.4805793762207, 'learning_rate': 9.999041600813393e-06, 'epoch': 0.04}
+  4%|▎         | 120/3309 [31:08<13:26:58, 15.18s/it]  4%|▎         | 121/3309 [31:24<13:45:34, 15.54s/it]  4%|▎         | 122/3309 [31:39<13:25:10, 15.16s/it]  4%|▎         | 123/3309 [31:53<13:16:41, 15.00s/it]  4%|▎         | 124/3309 [32:07<13:03:57, 14.77s/it]  4%|▍         | 125/3309 [32:24<13:27:58, 15.23s/it]  4%|▍         | 126/3309 [32:40<13:50:18, 15.65s/it]  4%|▍         | 127/3309 [32:57<14:02:07, 15.88s/it]  4%|▍         | 128/3309 [33:13<14:08:02, 16.00s/it]  4%|▍         | 129/3309 [33:28<13:46:32, 15.60s/it]  4%|▍         | 130/3309 [33:42<13:23:38, 15.17s/it]                                                     {'loss': 6.2416, 'grad_norm': 32.300174713134766, 'learning_rate': 9.997843687944153e-06, 'epoch': 0.04}
+  4%|▍         | 130/3309 [33:42<13:23:38, 15.17s/it]  4%|▍         | 131/3309 [33:56<13:08:06, 14.88s/it]  4%|▍         | 132/3309 [34:13<13:46:48, 15.61s/it]  4%|▍         | 133/3309 [34:28<13:30:35, 15.31s/it]  4%|▍         | 134/3309 [34:45<13:52:41, 15.74s/it]  4%|▍         | 135/3309 [35:01<14:06:18, 16.00s/it]  4%|▍         | 136/3309 [35:18<14:12:57, 16.13s/it]  4%|▍         | 137/3309 [35:34<14:19:07, 16.25s/it]  4%|▍         | 138/3309 [35:51<14:20:50, 16.29s/it]  4%|▍         | 139/3309 [36:05<13:46:13, 15.64s/it]  4%|▍         | 140/3309 [36:21<13:57:50, 15.86s/it]                                                     {'loss': 5.5583, 'grad_norm': 29.263317108154297, 'learning_rate': 9.996166770665168e-06, 'epoch': 0.04}
+  4%|▍         | 140/3309 [36:21<13:57:50, 15.86s/it]  4%|▍         | 141/3309 [36:35<13:30:08, 15.34s/it]  4%|▍         | 142/3309 [36:52<13:43:43, 15.61s/it]  4%|▍         | 143/3309 [37:05<13:15:57, 15.08s/it]  4%|▍         | 144/3309 [37:21<13:29:29, 15.35s/it]  4%|▍         | 145/3309 [37:38<13:43:02, 15.61s/it]  4%|▍         | 146/3309 [37:54<13:59:28, 15.92s/it]  4%|▍         | 147/3309 [38:09<13:38:05, 15.52s/it]  4%|▍         | 148/3309 [38:25<13:55:53, 15.87s/it]  5%|▍         | 149/3309 [38:42<14:07:42, 16.10s/it]  5%|▍         | 150/3309 [38:58<14:11:00, 16.16s/it]                                                     {'loss': 5.6737, 'grad_norm': 33.3656005859375, 'learning_rate': 9.994011009695908e-06, 'epoch': 0.05}
+  5%|▍         | 150/3309 [38:58<14:11:00, 16.16s/it]  5%|▍         | 151/3309 [39:13<13:47:13, 15.72s/it]  5%|▍         | 152/3309 [39:27<13:18:27, 15.18s/it]  5%|▍         | 153/3309 [39:41<12:59:21, 14.82s/it]  5%|▍         | 154/3309 [39:55<12:44:31, 14.54s/it]  5%|▍         | 155/3309 [40:11<13:15:37, 15.14s/it]  5%|▍         | 156/3309 [40:28<13:38:09, 15.57s/it]  5%|▍         | 157/3309 [40:44<13:49:27, 15.79s/it]  5%|▍         | 158/3309 [40:59<13:24:25, 15.32s/it]  5%|▍         | 159/3309 [41:13<13:12:42, 15.10s/it]  5%|▍         | 160/3309 [41:27<12:58:25, 14.83s/it]                                                     {'loss': 6.0879, 'grad_norm': 32.699825286865234, 'learning_rate': 9.991376611649278e-06, 'epoch': 0.05}
+  5%|▍         | 160/3309 [41:27<12:58:25, 14.83s/it]  5%|▍         | 161/3309 [41:44<13:20:54, 15.27s/it]  5%|▍         | 162/3309 [42:00<13:41:51, 15.67s/it]  5%|▍         | 163/3309 [42:15<13:24:15, 15.34s/it]  5%|▍         | 164/3309 [42:31<13:39:51, 15.64s/it]  5%|▍         | 165/3309 [42:48<13:55:35, 15.95s/it]  5%|▌         | 166/3309 [43:02<13:27:44, 15.42s/it]  5%|▌         | 167/3309 [43:18<13:40:06, 15.66s/it]  5%|▌         | 168/3309 [43:35<13:50:53, 15.87s/it]  5%|▌         | 169/3309 [43:51<13:57:44, 16.01s/it]  5%|▌         | 170/3309 [44:07<14:03:23, 16.12s/it]                                                     {'loss': 5.4056, 'grad_norm': 27.45968246459961, 'learning_rate': 9.988263829011821e-06, 'epoch': 0.05}
+  5%|▌         | 170/3309 [44:07<14:03:23, 16.12s/it]  5%|▌         | 171/3309 [44:21<13:32:37, 15.54s/it]  5%|▌         | 172/3309 [44:38<13:40:26, 15.69s/it]  5%|▌         | 173/3309 [44:54<13:50:11, 15.88s/it]  5%|▌         | 174/3309 [45:08<13:28:30, 15.47s/it]  5%|▌         | 175/3309 [45:23<13:08:45, 15.10s/it]  5%|▌         | 176/3309 [45:39<13:28:36, 15.49s/it]  5%|▌         | 177/3309 [45:53<13:08:56, 15.11s/it]  5%|▌         | 178/3309 [46:09<13:26:59, 15.46s/it]  5%|▌         | 179/3309 [46:26<13:39:32, 15.71s/it]  5%|▌         | 180/3309 [46:45<14:26:31, 16.62s/it]                                                     {'loss': 5.3618, 'grad_norm': 25.30878448486328, 'learning_rate': 9.984672960119523e-06, 'epoch': 0.05}
+  5%|▌         | 180/3309 [46:45<14:26:31, 16.62s/it]  5%|▌         | 181/3309 [46:59<13:48:37, 15.89s/it]  6%|▌         | 182/3309 [47:15<13:54:33, 16.01s/it]  6%|▌         | 183/3309 [47:31<13:57:21, 16.07s/it]  6%|▌         | 184/3309 [47:45<13:26:54, 15.49s/it]  6%|▌         | 185/3309 [48:00<13:13:17, 15.24s/it]  6%|▌         | 186/3309 [48:16<13:30:02, 15.56s/it]  6%|▌         | 187/3309 [48:31<13:08:37, 15.16s/it]  6%|▌         | 188/3309 [48:45<12:53:31, 14.87s/it]  6%|▌         | 189/3309 [48:59<12:43:54, 14.69s/it]  6%|▌         | 190/3309 [49:14<12:40:43, 14.63s/it]                                                     {'loss': 5.7602, 'grad_norm': 40.055721282958984, 'learning_rate': 9.980604349129212e-06, 'epoch': 0.06}
+  6%|▌         | 190/3309 [49:14<12:40:43, 14.63s/it]  6%|▌         | 191/3309 [49:27<12:29:22, 14.42s/it]  6%|▌         | 192/3309 [49:42<12:25:54, 14.36s/it]  6%|▌         | 193/3309 [49:58<12:54:39, 14.92s/it]  6%|▌         | 194/3309 [50:12<12:44:17, 14.72s/it]  6%|▌         | 195/3309 [50:26<12:36:26, 14.58s/it]  6%|▌         | 196/3309 [50:41<12:30:19, 14.46s/it]  6%|▌         | 197/3309 [50:57<13:04:52, 15.13s/it]  6%|▌         | 198/3309 [51:12<12:56:37, 14.98s/it]  6%|▌         | 199/3309 [51:26<12:43:20, 14.73s/it]  6%|▌         | 200/3309 [51:40<12:30:48, 14.49s/it]                                                     {'loss': 5.186, 'grad_norm': 26.245195388793945, 'learning_rate': 9.976058385985575e-06, 'epoch': 0.06}
+  6%|▌         | 200/3309 [51:40<12:30:48, 14.49s/it]  6%|▌         | 201/3309 [51:56<13:00:21, 15.06s/it]  6%|▌         | 202/3309 [52:13<13:20:00, 15.45s/it]  6%|▌         | 203/3309 [52:27<13:06:10, 15.19s/it]  6%|▌         | 204/3309 [52:44<13:27:51, 15.61s/it]  6%|▌         | 205/3309 [53:01<13:44:08, 15.93s/it]  6%|▌         | 206/3309 [53:17<13:50:48, 16.06s/it]  6%|▋         | 207/3309 [53:31<13:21:31, 15.50s/it]  6%|▋         | 208/3309 [53:47<13:33:33, 15.74s/it]  6%|▋         | 209/3309 [54:02<13:14:52, 15.38s/it]  6%|▋         | 210/3309 [54:16<12:56:08, 15.03s/it]                                                     {'loss': 5.5341, 'grad_norm': 34.81965637207031, 'learning_rate': 9.971035506383791e-06, 'epoch': 0.06}
+  6%|▋         | 210/3309 [54:16<12:56:08, 15.03s/it]  6%|▋         | 211/3309 [54:33<13:20:17, 15.50s/it]  6%|▋         | 212/3309 [54:49<13:37:36, 15.84s/it]  6%|▋         | 213/3309 [55:06<13:49:30, 16.08s/it]  6%|▋         | 214/3309 [55:20<13:16:12, 15.44s/it]  6%|▋         | 215/3309 [55:37<13:35:52, 15.82s/it]  7%|▋         | 216/3309 [55:51<13:17:49, 15.48s/it]  7%|▋         | 217/3309 [56:08<13:30:04, 15.72s/it]  7%|▋         | 218/3309 [56:24<13:44:55, 16.01s/it]  7%|▋         | 219/3309 [56:41<13:48:09, 16.08s/it]  7%|▋         | 220/3309 [56:57<13:52:29, 16.17s/it]                                                     {'loss': 5.0542, 'grad_norm': 29.513893127441406, 'learning_rate': 9.96553619172777e-06, 'epoch': 0.07}
+  7%|▋         | 220/3309 [56:57<13:52:29, 16.17s/it]  7%|▋         | 221/3309 [57:13<13:54:15, 16.21s/it]  7%|▋         | 222/3309 [57:30<13:57:36, 16.28s/it]  7%|▋         | 223/3309 [57:44<13:21:14, 15.58s/it]  7%|▋         | 224/3309 [58:03<14:14:41, 16.62s/it]  7%|▋         | 225/3309 [58:17<13:42:01, 15.99s/it]  7%|▋         | 226/3309 [58:32<13:19:42, 15.56s/it]  7%|▋         | 227/3309 [58:48<13:36:10, 15.89s/it]  7%|▋         | 228/3309 [59:03<13:10:18, 15.39s/it]  7%|▋         | 229/3309 [59:19<13:29:33, 15.77s/it]  7%|▋         | 230/3309 [59:36<13:39:44, 15.97s/it]                                                     {'loss': 5.3365, 'grad_norm': 32.30284118652344, 'learning_rate': 9.959560969084004e-06, 'epoch': 0.07}
+  7%|▋         | 230/3309 [59:36<13:39:44, 15.97s/it]  7%|▋         | 231/3309 [59:50<13:12:03, 15.44s/it]  7%|▋         | 232/3309 [1:00:05<12:59:07, 15.19s/it]  7%|▋         | 233/3309 [1:00:21<13:16:39, 15.54s/it]  7%|▋         | 234/3309 [1:00:38<13:32:59, 15.86s/it]  7%|▋         | 235/3309 [1:00:54<13:38:49, 15.98s/it]  7%|▋         | 236/3309 [1:01:08<13:12:00, 15.46s/it]  7%|▋         | 237/3309 [1:01:22<12:52:41, 15.09s/it]  7%|▋         | 238/3309 [1:01:39<13:11:53, 15.47s/it]  7%|▋         | 239/3309 [1:01:55<13:23:31, 15.70s/it]  7%|▋         | 240/3309 [1:02:09<12:59:55, 15.25s/it]                                                       {'loss': 4.7513, 'grad_norm': 27.652576446533203, 'learning_rate': 9.953110411131073e-06, 'epoch': 0.07}
+  7%|▋         | 240/3309 [1:02:09<12:59:55, 15.25s/it]  7%|▋         | 241/3309 [1:02:24<12:48:50, 15.04s/it]  7%|▋         | 242/3309 [1:02:40<13:08:23, 15.42s/it]  7%|▋         | 243/3309 [1:02:54<12:48:52, 15.05s/it]  7%|▋         | 244/3309 [1:03:11<13:12:46, 15.52s/it]  7%|▋         | 245/3309 [1:03:25<12:56:56, 15.21s/it]  7%|▋         | 246/3309 [1:03:42<13:19:00, 15.65s/it]  7%|▋         | 247/3309 [1:03:58<13:28:45, 15.85s/it]  7%|▋         | 248/3309 [1:04:15<13:39:16, 16.06s/it]  8%|▊         | 249/3309 [1:04:31<13:43:52, 16.15s/it]  8%|▊         | 250/3309 [1:04:45<13:14:16, 15.58s/it]                                                       {'loss': 5.4127, 'grad_norm': 28.387413024902344, 'learning_rate': 9.946185136104736e-06, 'epoch': 0.08}
+  8%|▊         | 250/3309 [1:04:45<13:14:16, 15.58s/it]  8%|▊         | 251/3309 [1:05:00<12:59:36, 15.30s/it]  8%|▊         | 252/3309 [1:05:16<13:13:40, 15.58s/it]  8%|▊         | 253/3309 [1:05:32<13:19:00, 15.69s/it]  8%|▊         | 254/3309 [1:05:48<13:26:43, 15.84s/it]  8%|▊         | 255/3309 [1:06:05<13:38:56, 16.09s/it]  8%|▊         | 256/3309 [1:06:22<13:46:34, 16.24s/it]  8%|▊         | 257/3309 [1:06:36<13:10:54, 15.55s/it]  8%|▊         | 258/3309 [1:06:52<13:21:14, 15.76s/it]  8%|▊         | 259/3309 [1:07:06<12:57:34, 15.30s/it]  8%|▊         | 260/3309 [1:07:22<13:13:18, 15.61s/it]                                                       {'loss': 4.813, 'grad_norm': 29.694316864013672, 'learning_rate': 9.938785807738692e-06, 'epoch': 0.08}
+  8%|▊         | 260/3309 [1:07:22<13:13:18, 15.61s/it]  8%|▊         | 261/3309 [1:07:39<13:24:01, 15.83s/it]  8%|▊         | 262/3309 [1:07:53<13:06:14, 15.48s/it]  8%|▊         | 263/3309 [1:08:10<13:19:05, 15.74s/it]  8%|▊         | 264/3309 [1:08:24<12:58:35, 15.34s/it]  8%|▊         | 265/3309 [1:08:39<12:45:18, 15.08s/it]  8%|▊         | 266/3309 [1:08:55<13:09:23, 15.56s/it]  8%|▊         | 267/3309 [1:09:12<13:25:56, 15.90s/it]  8%|▊         | 268/3309 [1:09:26<12:59:32, 15.38s/it]  8%|▊         | 269/3309 [1:09:42<13:13:18, 15.66s/it]  8%|▊         | 270/3309 [1:09:59<13:26:54, 15.93s/it]                                                       {'loss': 5.4212, 'grad_norm': 31.964120864868164, 'learning_rate': 9.930913135200964e-06, 'epoch': 0.08}
+  8%|▊         | 270/3309 [1:09:59<13:26:54, 15.93s/it]  8%|▊         | 271/3309 [1:10:13<13:00:16, 15.41s/it]  8%|▊         | 272/3309 [1:10:28<12:48:58, 15.19s/it]  8%|▊         | 273/3309 [1:10:42<12:29:06, 14.80s/it]  8%|▊         | 274/3309 [1:10:56<12:15:09, 14.53s/it]  8%|▊         | 275/3309 [1:11:10<12:10:22, 14.44s/it]  8%|▊         | 276/3309 [1:11:24<12:07:03, 14.38s/it]  8%|▊         | 277/3309 [1:11:38<12:04:16, 14.33s/it]  8%|▊         | 278/3309 [1:11:53<12:06:03, 14.37s/it]  8%|▊         | 279/3309 [1:12:10<12:40:02, 15.05s/it]  8%|▊         | 280/3309 [1:12:26<13:00:10, 15.45s/it]                                                       {'loss': 5.2445, 'grad_norm': 23.594715118408203, 'learning_rate': 9.922567873025924e-06, 'epoch': 0.08}
+  8%|▊         | 280/3309 [1:12:26<13:00:10, 15.45s/it]  8%|▊         | 281/3309 [1:12:40<12:40:58, 15.08s/it]  9%|▊         | 282/3309 [1:12:56<13:00:13, 15.47s/it]  9%|▊         | 283/3309 [1:13:10<12:37:35, 15.02s/it]  9%|▊         | 284/3309 [1:13:27<12:58:11, 15.44s/it]  9%|▊         | 285/3309 [1:13:41<12:39:20, 15.07s/it]  9%|▊         | 286/3309 [1:13:55<12:25:58, 14.81s/it]  9%|▊         | 287/3309 [1:14:10<12:17:23, 14.64s/it]  9%|▊         | 288/3309 [1:14:24<12:17:08, 14.64s/it]  9%|▊         | 289/3309 [1:14:41<12:42:19, 15.15s/it]  9%|▉         | 290/3309 [1:14:55<12:27:01, 14.85s/it]                                                       {'loss': 4.5194, 'grad_norm': 23.0896053314209, 'learning_rate': 9.913750821041988e-06, 'epoch': 0.09}
+  9%|▉         | 290/3309 [1:14:55<12:27:01, 14.85s/it]  9%|▉         | 291/3309 [1:15:11<12:43:25, 15.18s/it]  9%|▉         | 292/3309 [1:15:25<12:28:28, 14.89s/it]  9%|▉         | 293/3309 [1:15:39<12:21:04, 14.74s/it]  9%|▉         | 294/3309 [1:15:55<12:43:44, 15.20s/it]  9%|▉         | 295/3309 [1:16:09<12:22:59, 14.79s/it]  9%|▉         | 296/3309 [1:16:26<12:46:08, 15.26s/it]  9%|▉         | 297/3309 [1:16:40<12:29:38, 14.93s/it]  9%|▉         | 298/3309 [1:16:55<12:26:42, 14.88s/it]  9%|▉         | 299/3309 [1:17:09<12:17:15, 14.70s/it]  9%|▉         | 300/3309 [1:17:23<12:09:09, 14.54s/it]                                                       {'loss': 4.6093, 'grad_norm': 25.44329833984375, 'learning_rate': 9.904462824294945e-06, 'epoch': 0.09}
+  9%|▉         | 300/3309 [1:17:23<12:09:09, 14.54s/it]  9%|▉         | 301/3309 [1:17:37<12:04:18, 14.45s/it]  9%|▉         | 302/3309 [1:17:52<12:01:12, 14.39s/it]  9%|▉         | 303/3309 [1:18:08<12:29:54, 14.97s/it]  9%|▉         | 304/3309 [1:18:24<12:49:24, 15.36s/it]  9%|▉         | 305/3309 [1:18:40<13:03:47, 15.65s/it]  9%|▉         | 306/3309 [1:18:55<12:45:04, 15.29s/it]  9%|▉         | 307/3309 [1:19:09<12:28:18, 14.96s/it]  9%|▉         | 308/3309 [1:19:23<12:16:40, 14.73s/it]  9%|▉         | 309/3309 [1:19:40<12:42:02, 15.24s/it]  9%|▉         | 310/3309 [1:19:54<12:26:49, 14.94s/it]                                                       {'loss': 4.512, 'grad_norm': 27.408288955688477, 'learning_rate': 9.894704772966978e-06, 'epoch': 0.09}
+  9%|▉         | 310/3309 [1:19:54<12:26:49, 14.94s/it]  9%|▉         | 311/3309 [1:20:11<12:52:41, 15.46s/it]  9%|▉         | 312/3309 [1:20:25<12:37:57, 15.17s/it]  9%|▉         | 313/3309 [1:20:40<12:28:44, 14.99s/it]  9%|▉         | 314/3309 [1:20:55<12:27:15, 14.97s/it] 10%|▉         | 315/3309 [1:21:11<12:52:10, 15.47s/it] 10%|▉         | 316/3309 [1:21:28<13:04:23, 15.72s/it] 10%|▉         | 317/3309 [1:21:42<12:41:54, 15.28s/it] 10%|▉         | 318/3309 [1:21:56<12:26:01, 14.97s/it] 10%|▉         | 319/3309 [1:22:12<12:46:33, 15.38s/it] 10%|▉         | 320/3309 [1:22:29<12:59:32, 15.65s/it]                                                       {'loss': 4.5071, 'grad_norm': 24.26542091369629, 'learning_rate': 9.884477602291343e-06, 'epoch': 0.1}
+ 10%|▉         | 320/3309 [1:22:29<12:59:32, 15.65s/it] 10%|▉         | 321/3309 [1:22:45<13:09:29, 15.85s/it] 10%|▉         | 322/3309 [1:23:00<12:54:24, 15.56s/it] 10%|▉         | 323/3309 [1:23:14<12:34:24, 15.16s/it] 10%|▉         | 324/3309 [1:23:29<12:26:24, 15.00s/it] 10%|▉         | 325/3309 [1:23:43<12:14:03, 14.76s/it] 10%|▉         | 326/3309 [1:23:57<12:05:36, 14.59s/it] 10%|▉         | 327/3309 [1:24:13<12:29:48, 15.09s/it] 10%|▉         | 328/3309 [1:24:30<12:47:35, 15.45s/it] 10%|▉         | 329/3309 [1:24:46<13:06:06, 15.83s/it] 10%|▉         | 330/3309 [1:25:05<13:54:04, 16.80s/it]                                                       {'loss': 4.3557, 'grad_norm': 35.8819694519043, 'learning_rate': 9.873782292462727e-06, 'epoch': 0.1}
+ 10%|▉         | 330/3309 [1:25:05<13:54:04, 16.80s/it] 10%|█         | 331/3309 [1:25:20<13:20:02, 16.12s/it] 10%|█         | 332/3309 [1:25:37<13:37:30, 16.48s/it] 10%|█         | 333/3309 [1:25:52<13:06:40, 15.86s/it] 10%|█         | 334/3309 [1:26:06<12:41:37, 15.36s/it] 10%|█         | 335/3309 [1:26:21<12:31:09, 15.15s/it] 10%|█         | 336/3309 [1:26:35<12:23:25, 15.00s/it] 10%|█         | 337/3309 [1:26:50<12:17:03, 14.88s/it] 10%|█         | 338/3309 [1:27:06<12:38:11, 15.31s/it] 10%|█         | 339/3309 [1:27:21<12:27:24, 15.10s/it] 10%|█         | 340/3309 [1:27:37<12:45:31, 15.47s/it]                                                       {'loss': 8.2236, 'grad_norm': 29.487594604492188, 'learning_rate': 9.862619868543323e-06, 'epoch': 0.1}
+ 10%|█         | 340/3309 [1:27:37<12:45:31, 15.47s/it] 10%|█         | 341/3309 [1:27:54<13:03:25, 15.84s/it] 10%|█         | 342/3309 [1:28:10<13:14:07, 16.06s/it] 10%|█         | 343/3309 [1:28:27<13:21:50, 16.22s/it] 10%|█         | 344/3309 [1:28:43<13:22:35, 16.24s/it] 10%|█         | 345/3309 [1:28:58<12:55:28, 15.70s/it] 10%|█         | 346/3309 [1:29:12<12:32:13, 15.23s/it] 10%|█         | 347/3309 [1:29:29<12:53:22, 15.67s/it] 11%|█         | 348/3309 [1:29:45<13:03:53, 15.88s/it] 11%|█         | 349/3309 [1:30:01<13:09:59, 16.01s/it] 11%|█         | 350/3309 [1:30:16<12:45:46, 15.53s/it]                                                       {'loss': 5.1538, 'grad_norm': 38.13749694824219, 'learning_rate': 9.850991400364557e-06, 'epoch': 0.11}
+ 11%|█         | 350/3309 [1:30:16<12:45:46, 15.53s/it] 11%|█         | 351/3309 [1:30:30<12:26:26, 15.14s/it] 11%|█         | 352/3309 [1:30:46<12:43:37, 15.49s/it] 11%|█         | 353/3309 [1:31:01<12:28:57, 15.20s/it] 11%|█         | 354/3309 [1:31:17<12:45:18, 15.54s/it] 11%|█         | 355/3309 [1:31:34<13:01:20, 15.87s/it] 11%|█         | 356/3309 [1:31:48<12:35:42, 15.35s/it] 11%|█         | 357/3309 [1:32:04<12:49:18, 15.64s/it] 11%|█         | 358/3309 [1:32:19<12:35:04, 15.35s/it] 11%|█         | 359/3309 [1:32:33<12:18:50, 15.03s/it] 11%|█         | 360/3309 [1:32:49<12:38:20, 15.43s/it]                                                       {'loss': 6.0666, 'grad_norm': 25.492799758911133, 'learning_rate': 9.838898002424586e-06, 'epoch': 0.11}
+ 11%|█         | 360/3309 [1:32:49<12:38:20, 15.43s/it] 11%|█         | 361/3309 [1:33:06<12:55:40, 15.79s/it] 11%|█         | 362/3309 [1:33:21<12:37:13, 15.42s/it] 11%|█         | 363/3309 [1:33:37<12:50:54, 15.70s/it] 11%|█         | 364/3309 [1:33:53<12:59:49, 15.89s/it] 11%|█         | 365/3309 [1:34:08<12:37:04, 15.43s/it] 11%|█         | 366/3309 [1:34:24<12:54:18, 15.79s/it] 11%|█         | 367/3309 [1:34:40<13:00:32, 15.92s/it] 11%|█         | 368/3309 [1:34:55<12:34:32, 15.39s/it] 11%|█         | 369/3309 [1:35:09<12:23:54, 15.18s/it] 11%|█         | 370/3309 [1:35:26<12:39:32, 15.51s/it]                                                       {'loss': 5.8633, 'grad_norm': 31.119089126586914, 'learning_rate': 9.826340833781448e-06, 'epoch': 0.11}
+ 11%|█         | 370/3309 [1:35:26<12:39:32, 15.51s/it] 11%|█         | 371/3309 [1:35:39<12:15:30, 15.02s/it] 11%|█         | 372/3309 [1:35:58<13:10:40, 16.15s/it] 11%|█▏        | 373/3309 [1:36:13<12:42:08, 15.58s/it] 11%|█▏        | 374/3309 [1:36:27<12:27:42, 15.29s/it] 11%|█▏        | 375/3309 [1:36:44<12:54:56, 15.85s/it] 11%|█▏        | 376/3309 [1:37:01<13:02:31, 16.01s/it] 11%|█▏        | 377/3309 [1:37:17<13:10:59, 16.19s/it] 11%|█▏        | 378/3309 [1:37:32<12:55:04, 15.87s/it] 11%|█▏        | 379/3309 [1:37:48<12:56:34, 15.90s/it] 11%|█▏        | 380/3309 [1:38:05<13:07:05, 16.12s/it]                                                       {'loss': 5.1017, 'grad_norm': 21.065149307250977, 'learning_rate': 9.813321097942005e-06, 'epoch': 0.11}
+ 11%|█▏        | 380/3309 [1:38:05<13:07:05, 16.12s/it] 12%|█▏        | 381/3309 [1:38:19<12:38:49, 15.55s/it] 12%|█▏        | 382/3309 [1:38:34<12:20:45, 15.18s/it] 12%|█▏        | 383/3309 [1:38:50<12:42:16, 15.63s/it] 12%|█▏        | 384/3309 [1:39:07<12:52:47, 15.85s/it] 12%|█▏        | 385/3309 [1:39:21<12:28:14, 15.35s/it] 12%|█▏        | 386/3309 [1:39:35<12:09:25, 14.97s/it] 12%|█▏        | 387/3309 [1:39:51<12:30:14, 15.41s/it] 12%|█▏        | 388/3309 [1:40:08<12:43:42, 15.69s/it] 12%|█▏        | 389/3309 [1:40:24<12:57:00, 15.97s/it] 12%|█▏        | 390/3309 [1:40:41<13:01:32, 16.06s/it]                                                       {'loss': 4.9132, 'grad_norm': 29.40814971923828, 'learning_rate': 9.79984004274658e-06, 'epoch': 0.12}
+ 12%|█▏        | 390/3309 [1:40:41<13:01:32, 16.06s/it] 12%|█▏        | 391/3309 [1:40:57<13:05:41, 16.16s/it] 12%|█▏        | 392/3309 [1:41:11<12:36:32, 15.56s/it] 12%|█▏        | 393/3309 [1:41:26<12:22:39, 15.28s/it] 12%|█▏        | 394/3309 [1:41:42<12:37:38, 15.59s/it] 12%|█▏        | 395/3309 [1:41:58<12:47:24, 15.80s/it] 12%|█▏        | 396/3309 [1:42:15<12:53:25, 15.93s/it] 12%|█▏        | 397/3309 [1:42:31<12:58:10, 16.03s/it] 12%|█▏        | 398/3309 [1:42:47<13:02:23, 16.13s/it] 12%|█▏        | 399/3309 [1:43:03<13:04:51, 16.18s/it] 12%|█▏        | 400/3309 [1:43:18<12:36:09, 15.60s/it]                                                       {'loss': 4.2496, 'grad_norm': 22.45477294921875, 'learning_rate': 9.785898960249365e-06, 'epoch': 0.12}
+ 12%|█▏        | 400/3309 [1:43:18<12:36:09, 15.60s/it] 12%|█▏        | 401/3309 [1:43:34<12:46:27, 15.81s/it] 12%|█▏        | 402/3309 [1:43:51<12:58:03, 16.06s/it] 12%|█▏        | 403/3309 [1:44:05<12:37:52, 15.65s/it] 12%|█▏        | 404/3309 [1:44:20<12:22:37, 15.34s/it] 12%|█▏        | 405/3309 [1:44:36<12:37:14, 15.65s/it] 12%|█▏        | 406/3309 [1:44:53<12:51:02, 15.94s/it] 12%|█▏        | 407/3309 [1:45:09<12:56:29, 16.05s/it] 12%|█▏        | 408/3309 [1:45:26<13:00:11, 16.14s/it] 12%|█▏        | 409/3309 [1:45:42<13:02:21, 16.19s/it] 12%|█▏        | 410/3309 [1:45:59<13:09:04, 16.33s/it]                                                       {'loss': 5.0767, 'grad_norm': 19.05487060546875, 'learning_rate': 9.771499186594586e-06, 'epoch': 0.12}
+ 12%|█▏        | 410/3309 [1:45:59<13:09:04, 16.33s/it] 12%|█▏        | 411/3309 [1:46:15<13:09:44, 16.35s/it] 12%|█▏        | 412/3309 [1:46:30<12:44:48, 15.84s/it] 12%|█▏        | 413/3309 [1:46:44<12:27:28, 15.49s/it] 13%|█▎        | 414/3309 [1:47:01<12:44:50, 15.85s/it] 13%|█▎        | 415/3309 [1:47:17<12:51:57, 16.00s/it] 13%|█▎        | 416/3309 [1:47:34<12:56:32, 16.11s/it] 13%|█▎        | 417/3309 [1:47:50<12:59:53, 16.18s/it] 13%|█▎        | 418/3309 [1:48:06<13:01:14, 16.21s/it] 13%|█▎        | 419/3309 [1:48:21<12:32:23, 15.62s/it] 13%|█▎        | 420/3309 [1:48:37<12:47:24, 15.94s/it]                                                       {'loss': 5.192, 'grad_norm': 31.310686111450195, 'learning_rate': 9.756642101888449e-06, 'epoch': 0.13}
+ 13%|█▎        | 420/3309 [1:48:37<12:47:24, 15.94s/it] 13%|█▎        | 421/3309 [1:48:51<12:22:26, 15.42s/it] 13%|█▎        | 422/3309 [1:49:08<12:39:49, 15.79s/it] 13%|█▎        | 423/3309 [1:49:22<12:16:06, 15.30s/it] 13%|█▎        | 424/3309 [1:49:39<12:31:22, 15.63s/it] 13%|█▎        | 425/3309 [1:49:55<12:41:17, 15.84s/it] 13%|█▎        | 426/3309 [1:50:09<12:17:09, 15.34s/it] 13%|█▎        | 427/3309 [1:50:23<12:00:49, 15.01s/it] 13%|█▎        | 428/3309 [1:50:38<11:48:45, 14.76s/it] 13%|█▎        | 429/3309 [1:50:54<12:10:02, 15.21s/it] 13%|█▎        | 430/3309 [1:51:10<12:26:03, 15.55s/it]                                                       {'loss': 3.445, 'grad_norm': 25.689640045166016, 'learning_rate': 9.74132913006686e-06, 'epoch': 0.13}
+ 13%|█▎        | 430/3309 [1:51:10<12:26:03, 15.55s/it] 13%|█▎        | 431/3309 [1:51:27<12:37:41, 15.80s/it] 13%|█▎        | 432/3309 [1:51:43<12:45:40, 15.97s/it] 13%|█▎        | 433/3309 [1:52:00<12:56:03, 16.19s/it] 13%|█▎        | 434/3309 [1:52:16<13:02:18, 16.33s/it] 13%|█▎        | 435/3309 [1:52:31<12:32:08, 15.70s/it] 13%|█▎        | 436/3309 [1:52:45<12:09:27, 15.23s/it] 13%|█▎        | 437/3309 [1:52:59<11:55:32, 14.95s/it] 13%|█▎        | 438/3309 [1:53:16<12:19:40, 15.46s/it] 13%|█▎        | 439/3309 [1:53:32<12:32:14, 15.73s/it] 13%|█▎        | 440/3309 [1:53:46<12:09:36, 15.26s/it]                                                       {'loss': 3.3354, 'grad_norm': 21.052574157714844, 'learning_rate': 9.725561738758956e-06, 'epoch': 0.13}
+ 13%|█▎        | 440/3309 [1:53:46<12:09:36, 15.26s/it] 13%|█▎        | 441/3309 [1:54:03<12:25:27, 15.60s/it] 13%|█▎        | 442/3309 [1:54:19<12:36:02, 15.82s/it] 13%|█▎        | 443/3309 [1:54:33<12:16:38, 15.42s/it] 13%|█▎        | 444/3309 [1:54:48<12:03:55, 15.16s/it] 13%|█▎        | 445/3309 [1:55:02<11:46:46, 14.81s/it] 13%|█▎        | 446/3309 [1:55:19<12:13:01, 15.36s/it] 14%|█▎        | 447/3309 [1:55:35<12:27:18, 15.67s/it] 14%|█▎        | 448/3309 [1:55:49<12:07:15, 15.25s/it] 14%|█▎        | 449/3309 [1:56:06<12:26:21, 15.66s/it] 14%|█▎        | 450/3309 [1:56:20<12:05:23, 15.22s/it]                                                       {'loss': 5.0777, 'grad_norm': 24.987884521484375, 'learning_rate': 9.709341439146452e-06, 'epoch': 0.14}
+ 14%|█▎        | 450/3309 [1:56:20<12:05:23, 15.22s/it] 14%|█▎        | 451/3309 [1:56:37<12:26:13, 15.67s/it] 14%|█▎        | 452/3309 [1:56:53<12:35:27, 15.87s/it] 14%|█▎        | 453/3309 [1:57:08<12:16:37, 15.48s/it] 14%|█▎        | 454/3309 [1:57:22<11:57:49, 15.09s/it] 14%|█▍        | 455/3309 [1:57:38<12:16:27, 15.48s/it] 14%|█▍        | 456/3309 [1:57:55<12:32:39, 15.83s/it] 14%|█▍        | 457/3309 [1:58:09<12:11:29, 15.39s/it] 14%|█▍        | 458/3309 [1:58:24<11:58:12, 15.12s/it] 14%|█▍        | 459/3309 [1:58:38<11:50:32, 14.96s/it] 14%|█▍        | 460/3309 [1:58:53<11:40:27, 14.75s/it]                                                       {'loss': 6.4292, 'grad_norm': 26.842397689819336, 'learning_rate': 9.692669785818787e-06, 'epoch': 0.14}
+ 14%|█▍        | 460/3309 [1:58:53<11:40:27, 14.75s/it] 14%|█▍        | 461/3309 [1:59:09<12:03:25, 15.24s/it] 14%|█▍        | 462/3309 [1:59:23<11:48:59, 14.94s/it] 14%|█▍        | 463/3309 [1:59:37<11:37:01, 14.69s/it] 14%|█▍        | 464/3309 [1:59:52<11:33:18, 14.62s/it] 14%|█▍        | 465/3309 [2:00:06<11:34:15, 14.65s/it] 14%|█▍        | 466/3309 [2:00:20<11:23:30, 14.43s/it] 14%|█▍        | 467/3309 [2:00:37<11:54:56, 15.09s/it] 14%|█▍        | 468/3309 [2:00:54<12:16:28, 15.55s/it] 14%|█▍        | 469/3309 [2:01:10<12:30:28, 15.86s/it] 14%|█▍        | 470/3309 [2:01:25<12:13:53, 15.51s/it]                                                       {'loss': 5.7348, 'grad_norm': 35.66836166381836, 'learning_rate': 9.675548376624149e-06, 'epoch': 0.14}
+ 14%|█▍        | 470/3309 [2:01:25<12:13:53, 15.51s/it] 14%|█▍        | 471/3309 [2:01:42<12:29:47, 15.85s/it] 14%|█▍        | 472/3309 [2:01:55<12:02:21, 15.28s/it] 14%|█▍        | 473/3309 [2:02:10<11:53:06, 15.09s/it] 14%|█▍        | 474/3309 [2:02:24<11:40:00, 14.82s/it] 14%|█▍        | 475/3309 [2:02:39<11:37:18, 14.76s/it] 14%|█▍        | 476/3309 [2:02:53<11:30:14, 14.62s/it] 14%|█▍        | 477/3309 [2:03:09<11:52:48, 15.10s/it] 14%|█▍        | 478/3309 [2:03:26<12:10:16, 15.48s/it] 14%|█▍        | 479/3309 [2:03:41<11:58:57, 15.24s/it] 15%|█▍        | 480/3309 [2:03:55<11:43:40, 14.92s/it]                                                       {'loss': 5.6924, 'grad_norm': 29.318471908569336, 'learning_rate': 9.657978852516318e-06, 'epoch': 0.15}
+ 15%|█▍        | 480/3309 [2:03:55<11:43:40, 14.92s/it] 15%|█▍        | 481/3309 [2:04:09<11:32:45, 14.70s/it] 15%|█▍        | 482/3309 [2:04:23<11:25:36, 14.55s/it] 15%|█▍        | 483/3309 [2:04:38<11:24:44, 14.54s/it] 15%|█▍        | 484/3309 [2:04:54<11:49:47, 15.08s/it] 15%|█▍        | 485/3309 [2:05:08<11:37:41, 14.82s/it] 15%|█▍        | 486/3309 [2:05:25<12:02:56, 15.37s/it] 15%|█▍        | 487/3309 [2:05:39<11:45:53, 15.01s/it] 15%|█▍        | 488/3309 [2:05:53<11:34:56, 14.78s/it] 15%|█▍        | 489/3309 [2:06:09<11:55:46, 15.23s/it] 15%|█▍        | 490/3309 [2:06:26<12:15:20, 15.65s/it]                                                       {'loss': 4.183, 'grad_norm': 23.544092178344727, 'learning_rate': 9.639962897397405e-06, 'epoch': 0.15}
+ 15%|█▍        | 490/3309 [2:06:26<12:15:20, 15.65s/it] 15%|█▍        | 491/3309 [2:06:42<12:25:16, 15.87s/it] 15%|█▍        | 492/3309 [2:06:57<12:04:43, 15.44s/it] 15%|█▍        | 493/3309 [2:07:11<11:46:50, 15.06s/it] 15%|█▍        | 494/3309 [2:07:27<12:04:25, 15.44s/it] 15%|█▍        | 495/3309 [2:07:44<12:20:56, 15.80s/it] 15%|█▍        | 496/3309 [2:08:00<12:29:00, 15.98s/it] 15%|█▌        | 497/3309 [2:08:15<12:03:59, 15.45s/it] 15%|█▌        | 498/3309 [2:08:29<11:49:53, 15.15s/it] 15%|█▌        | 499/3309 [2:08:43<11:36:41, 14.88s/it] 15%|█▌        | 500/3309 [2:08:58<11:27:27, 14.68s/it]                                                       {'loss': 5.085, 'grad_norm': 22.90180206298828, 'learning_rate': 9.621502237956452e-06, 'epoch': 0.15}
+ 15%|█▌        | 500/3309 [2:08:58<11:27:27, 14.68s/it] 15%|█▌        | 501/3309 [2:09:14<11:50:32, 15.18s/it] 15%|█▌        | 502/3309 [2:09:28<11:33:12, 14.82s/it] 15%|█▌        | 503/3309 [2:09:42<11:21:10, 14.57s/it] 15%|█▌        | 504/3309 [2:09:56<11:15:32, 14.45s/it] 15%|█▌        | 505/3309 [2:10:10<11:11:47, 14.38s/it] 15%|█▌        | 506/3309 [2:10:26<11:37:22, 14.93s/it] 15%|█▌        | 507/3309 [2:10:43<11:57:00, 15.35s/it] 15%|█▌        | 508/3309 [2:10:59<12:14:16, 15.73s/it] 15%|█▌        | 509/3309 [2:11:14<11:52:36, 15.27s/it] 15%|█▌        | 510/3309 [2:11:28<11:38:05, 14.96s/it]                                                       {'loss': 3.2694, 'grad_norm': 23.748275756835938, 'learning_rate': 9.602598643503957e-06, 'epoch': 0.15}
+ 15%|█▌        | 510/3309 [2:11:28<11:38:05, 14.96s/it] 15%|█▌        | 511/3309 [2:11:44<11:56:09, 15.36s/it] 15%|█▌        | 512/3309 [2:11:59<11:43:45, 15.10s/it] 16%|█▌        | 513/3309 [2:12:13<11:32:27, 14.86s/it] 16%|█▌        | 514/3309 [2:12:29<11:52:12, 15.29s/it] 16%|█▌        | 515/3309 [2:12:44<11:40:29, 15.04s/it] 16%|█▌        | 516/3309 [2:12:58<11:27:24, 14.77s/it] 16%|█▌        | 517/3309 [2:13:14<11:47:52, 15.21s/it] 16%|█▌        | 518/3309 [2:13:30<12:02:39, 15.54s/it] 16%|█▌        | 519/3309 [2:13:47<12:14:23, 15.79s/it] 16%|█▌        | 520/3309 [2:14:03<12:21:47, 15.96s/it]                                                       {'loss': 4.2373, 'grad_norm': 29.096708297729492, 'learning_rate': 9.583253925802283e-06, 'epoch': 0.16}
+ 16%|█▌        | 520/3309 [2:14:03<12:21:47, 15.96s/it] 16%|█▌        | 521/3309 [2:14:17<11:57:26, 15.44s/it] 16%|█▌        | 522/3309 [2:14:32<11:44:51, 15.17s/it] 16%|█▌        | 523/3309 [2:14:48<12:00:13, 15.51s/it] 16%|█▌        | 524/3309 [2:15:05<12:16:13, 15.86s/it] 16%|█▌        | 525/3309 [2:15:20<11:59:33, 15.51s/it] 16%|█▌        | 526/3309 [2:15:36<12:11:02, 15.76s/it] 16%|█▌        | 527/3309 [2:15:52<12:18:53, 15.94s/it] 16%|█▌        | 528/3309 [2:16:08<12:22:48, 16.03s/it] 16%|█▌        | 529/3309 [2:16:25<12:28:11, 16.15s/it] 16%|█▌        | 530/3309 [2:16:41<12:30:07, 16.20s/it]                                                       {'loss': 4.8482, 'grad_norm': 24.87314796447754, 'learning_rate': 9.563469938892023e-06, 'epoch': 0.16}
+ 16%|█▌        | 530/3309 [2:16:41<12:30:07, 16.20s/it] 16%|█▌        | 531/3309 [2:16:57<12:30:46, 16.22s/it] 16%|█▌        | 532/3309 [2:17:12<12:02:43, 15.62s/it] 16%|█▌        | 533/3309 [2:17:28<12:16:03, 15.91s/it] 16%|█▌        | 534/3309 [2:17:45<12:26:35, 16.14s/it] 16%|█▌        | 535/3309 [2:18:02<12:33:08, 16.29s/it] 16%|█▌        | 536/3309 [2:18:16<12:04:45, 15.68s/it] 16%|█▌        | 537/3309 [2:18:32<12:17:22, 15.96s/it] 16%|█▋        | 538/3309 [2:18:49<12:26:15, 16.16s/it] 16%|█▋        | 539/3309 [2:19:03<11:58:22, 15.56s/it] 16%|█▋        | 540/3309 [2:19:18<11:39:47, 15.16s/it]                                                       {'loss': 3.2299, 'grad_norm': 24.310091018676758, 'learning_rate': 9.543248578914309e-06, 'epoch': 0.16}
+ 16%|█▋        | 540/3309 [2:19:18<11:39:47, 15.16s/it] 16%|█▋        | 541/3309 [2:19:34<11:59:39, 15.60s/it] 16%|█▋        | 542/3309 [2:19:50<12:08:18, 15.79s/it] 16%|█▋        | 543/3309 [2:20:07<12:15:16, 15.95s/it] 16%|█▋        | 544/3309 [2:20:23<12:18:34, 16.03s/it] 16%|█▋        | 545/3309 [2:20:37<11:52:46, 15.47s/it] 17%|█▋        | 546/3309 [2:20:52<11:40:49, 15.22s/it] 17%|█▋        | 547/3309 [2:21:08<11:55:28, 15.54s/it] 17%|█▋        | 548/3309 [2:21:25<12:11:33, 15.90s/it] 17%|█▋        | 549/3309 [2:21:39<11:52:08, 15.48s/it] 17%|█▋        | 550/3309 [2:21:56<12:04:00, 15.75s/it]                                                       {'loss': 4.8424, 'grad_norm': 24.80878257751465, 'learning_rate': 9.522591783929069e-06, 'epoch': 0.17}
+ 17%|█▋        | 550/3309 [2:21:56<12:04:00, 15.75s/it] 17%|█▋        | 551/3309 [2:22:12<12:11:12, 15.91s/it] 17%|█▋        | 552/3309 [2:22:28<12:15:06, 16.00s/it] 17%|█▋        | 553/3309 [2:22:43<11:53:54, 15.54s/it] 17%|█▋        | 554/3309 [2:22:57<11:44:32, 15.34s/it] 17%|█▋        | 555/3309 [2:23:14<12:01:36, 15.72s/it] 17%|█▋        | 556/3309 [2:23:30<12:10:10, 15.91s/it] 17%|█▋        | 557/3309 [2:23:47<12:14:22, 16.01s/it] 17%|█▋        | 558/3309 [2:24:03<12:17:43, 16.09s/it] 17%|█▋        | 559/3309 [2:24:17<11:55:32, 15.61s/it] 17%|█▋        | 560/3309 [2:24:32<11:35:18, 15.18s/it]                                                       {'loss': 4.1786, 'grad_norm': 22.142215728759766, 'learning_rate': 9.501501533729297e-06, 'epoch': 0.17}
+ 17%|█▋        | 560/3309 [2:24:32<11:35:18, 15.18s/it] 17%|█▋        | 561/3309 [2:24:46<11:27:29, 15.01s/it] 17%|█▋        | 562/3309 [2:25:03<11:50:46, 15.52s/it] 17%|█▋        | 563/3309 [2:25:19<12:00:56, 15.75s/it] 17%|█▋        | 564/3309 [2:25:36<12:09:03, 15.94s/it] 17%|█▋        | 565/3309 [2:25:50<11:44:56, 15.41s/it] 17%|█▋        | 566/3309 [2:26:04<11:32:42, 15.15s/it] 17%|█▋        | 567/3309 [2:26:21<11:49:06, 15.52s/it] 17%|█▋        | 568/3309 [2:26:37<11:59:26, 15.75s/it] 17%|█▋        | 569/3309 [2:26:52<11:42:52, 15.39s/it] 17%|█▋        | 570/3309 [2:27:06<11:33:18, 15.19s/it]                                                       {'loss': 5.7505, 'grad_norm': 33.77587890625, 'learning_rate': 9.479979849651287e-06, 'epoch': 0.17}
+ 17%|█▋        | 570/3309 [2:27:06<11:33:18, 15.19s/it] 17%|█▋        | 571/3309 [2:27:23<11:48:29, 15.53s/it] 17%|█▋        | 572/3309 [2:27:37<11:36:10, 15.26s/it] 17%|█▋        | 573/3309 [2:27:52<11:25:59, 15.04s/it] 17%|█▋        | 574/3309 [2:28:06<11:17:53, 14.87s/it] 17%|█▋        | 575/3309 [2:28:21<11:14:04, 14.79s/it] 17%|█▋        | 576/3309 [2:28:37<11:38:54, 15.34s/it] 17%|█▋        | 577/3309 [2:28:54<11:56:14, 15.73s/it] 17%|█▋        | 578/3309 [2:29:11<12:09:00, 16.02s/it] 17%|█▋        | 579/3309 [2:29:27<12:12:33, 16.10s/it] 18%|█▊        | 580/3309 [2:29:44<12:23:47, 16.35s/it]                                                       {'loss': 6.3392, 'grad_norm': 25.414831161499023, 'learning_rate': 9.45802879438091e-06, 'epoch': 0.18}
+ 18%|█▊        | 580/3309 [2:29:44<12:23:47, 16.35s/it] 18%|█▊        | 581/3309 [2:30:00<12:23:39, 16.36s/it] 18%|█▊        | 582/3309 [2:30:15<11:57:10, 15.78s/it] 18%|█▊        | 583/3309 [2:30:31<12:03:14, 15.92s/it] 18%|█▊        | 584/3309 [2:30:45<11:39:23, 15.40s/it] 18%|█▊        | 585/3309 [2:30:59<11:22:26, 15.03s/it] 18%|█▊        | 586/3309 [2:31:18<12:13:11, 16.16s/it] 18%|█▊        | 587/3309 [2:31:32<11:47:15, 15.59s/it] 18%|█▊        | 588/3309 [2:31:49<12:00:58, 15.90s/it] 18%|█▊        | 589/3309 [2:32:05<12:06:02, 16.02s/it] 18%|█▊        | 590/3309 [2:32:22<12:10:13, 16.11s/it]                                                       {'loss': 4.1603, 'grad_norm': 25.716073989868164, 'learning_rate': 9.43565047175593e-06, 'epoch': 0.18}
+ 18%|█▊        | 590/3309 [2:32:22<12:10:13, 16.11s/it] 18%|█▊        | 591/3309 [2:32:38<12:12:27, 16.17s/it] 18%|█▊        | 592/3309 [2:32:52<11:42:10, 15.51s/it] 18%|█▊        | 593/3309 [2:33:09<11:56:42, 15.83s/it] 18%|█▊        | 594/3309 [2:33:23<11:38:18, 15.43s/it] 18%|█▊        | 595/3309 [2:33:40<11:58:30, 15.88s/it] 18%|█▊        | 596/3309 [2:33:56<12:05:07, 16.04s/it] 18%|█▊        | 597/3309 [2:34:13<12:08:11, 16.11s/it] 18%|█▊        | 598/3309 [2:34:29<12:15:23, 16.28s/it] 18%|█▊        | 599/3309 [2:34:46<12:16:17, 16.30s/it] 18%|█▊        | 600/3309 [2:35:02<12:16:56, 16.32s/it]                                                       {'loss': 3.9676, 'grad_norm': 25.389522552490234, 'learning_rate': 9.412847026564359e-06, 'epoch': 0.18}
+ 18%|█▊        | 600/3309 [2:35:02<12:16:56, 16.32s/it] 18%|█▊        | 601/3309 [2:35:18<12:16:28, 16.32s/it] 18%|█▊        | 602/3309 [2:35:35<12:19:59, 16.40s/it] 18%|█▊        | 603/3309 [2:35:49<11:46:30, 15.67s/it] 18%|█▊        | 604/3309 [2:36:04<11:32:30, 15.36s/it] 18%|█▊        | 605/3309 [2:36:18<11:16:52, 15.02s/it] 18%|█▊        | 606/3309 [2:36:32<11:01:26, 14.68s/it] 18%|█▊        | 607/3309 [2:36:46<10:55:30, 14.56s/it] 18%|█▊        | 608/3309 [2:37:02<11:18:55, 15.08s/it] 18%|█▊        | 609/3309 [2:37:16<11:06:16, 14.81s/it] 18%|█▊        | 610/3309 [2:37:33<11:36:43, 15.49s/it]                                                       {'loss': 4.1508, 'grad_norm': 22.911640167236328, 'learning_rate': 9.389620644338893e-06, 'epoch': 0.18}
+ 18%|█▊        | 610/3309 [2:37:33<11:36:43, 15.49s/it] 18%|█▊        | 611/3309 [2:37:50<11:49:40, 15.78s/it] 18%|█▊        | 612/3309 [2:38:06<11:55:45, 15.92s/it] 19%|█▊        | 613/3309 [2:38:21<11:38:24, 15.54s/it] 19%|█▊        | 614/3309 [2:38:35<11:20:57, 15.16s/it] 19%|█▊        | 615/3309 [2:38:51<11:36:44, 15.52s/it] 19%|█▊        | 616/3309 [2:39:08<11:46:27, 15.74s/it] 19%|█▊        | 617/3309 [2:39:24<11:54:55, 15.93s/it] 19%|█▊        | 618/3309 [2:39:40<11:58:32, 16.02s/it] 19%|█▊        | 619/3309 [2:39:55<11:33:43, 15.47s/it] 19%|█▊        | 620/3309 [2:40:09<11:19:54, 15.17s/it]                                                       {'loss': 4.691, 'grad_norm': 36.27210998535156, 'learning_rate': 9.365973551147453e-06, 'epoch': 0.19}
+ 19%|█▊        | 620/3309 [2:40:09<11:19:54, 15.17s/it] 19%|█▉        | 621/3309 [2:40:24<11:16:14, 15.09s/it] 19%|█▉        | 622/3309 [2:40:38<11:03:55, 14.83s/it] 19%|█▉        | 623/3309 [2:40:52<10:55:35, 14.64s/it] 19%|█▉        | 624/3309 [2:41:07<10:53:19, 14.60s/it] 19%|█▉        | 625/3309 [2:41:23<11:16:28, 15.12s/it] 19%|█▉        | 626/3309 [2:41:39<11:31:00, 15.45s/it] 19%|█▉        | 627/3309 [2:41:54<11:14:20, 15.09s/it] 19%|█▉        | 628/3309 [2:42:10<11:30:38, 15.46s/it] 19%|█▉        | 629/3309 [2:42:24<11:15:53, 15.13s/it] 19%|█▉        | 630/3309 [2:42:41<11:35:35, 15.58s/it]                                                       {'loss': 4.7148, 'grad_norm': 23.555246353149414, 'learning_rate': 9.341908013379832e-06, 'epoch': 0.19}
+ 19%|█▉        | 630/3309 [2:42:41<11:35:35, 15.58s/it] 19%|█▉        | 631/3309 [2:42:57<11:43:59, 15.77s/it] 19%|█▉        | 632/3309 [2:43:12<11:28:23, 15.43s/it] 19%|█▉        | 633/3309 [2:43:26<11:11:57, 15.07s/it] 19%|█▉        | 634/3309 [2:43:40<10:57:18, 14.74s/it] 19%|█▉        | 635/3309 [2:43:57<11:23:38, 15.34s/it] 19%|█▉        | 636/3309 [2:44:13<11:37:38, 15.66s/it] 19%|█▉        | 637/3309 [2:44:27<11:17:46, 15.22s/it] 19%|█▉        | 638/3309 [2:44:44<11:31:13, 15.53s/it] 19%|█▉        | 639/3309 [2:45:00<11:45:16, 15.85s/it] 19%|█▉        | 640/3309 [2:45:16<11:50:26, 15.97s/it]                                                       {'loss': 4.0105, 'grad_norm': 25.42097282409668, 'learning_rate': 9.317426337530477e-06, 'epoch': 0.19}
+ 19%|█▉        | 640/3309 [2:45:16<11:50:26, 15.97s/it] 19%|█▉        | 641/3309 [2:45:33<11:54:51, 16.08s/it] 19%|█▉        | 642/3309 [2:45:47<11:33:01, 15.59s/it] 19%|█▉        | 643/3309 [2:46:03<11:41:09, 15.78s/it] 19%|█▉        | 644/3309 [2:46:20<11:47:49, 15.94s/it] 19%|█▉        | 645/3309 [2:46:36<11:51:16, 16.02s/it] 20%|█▉        | 646/3309 [2:46:50<11:26:28, 15.47s/it] 20%|█▉        | 647/3309 [2:47:07<11:38:03, 15.73s/it] 20%|█▉        | 648/3309 [2:47:21<11:23:04, 15.40s/it] 20%|█▉        | 649/3309 [2:47:36<11:09:11, 15.09s/it] 20%|█▉        | 650/3309 [2:47:52<11:29:26, 15.56s/it]                                                       {'loss': 5.5589, 'grad_norm': 24.92901611328125, 'learning_rate': 9.292530869977432e-06, 'epoch': 0.2}
+ 20%|█▉        | 650/3309 [2:47:52<11:29:26, 15.56s/it] 20%|█▉        | 651/3309 [2:48:06<11:11:13, 15.15s/it] 20%|█▉        | 652/3309 [2:48:23<11:30:42, 15.60s/it] 20%|█▉        | 653/3309 [2:48:39<11:40:52, 15.83s/it] 20%|█▉        | 654/3309 [2:48:56<11:51:15, 16.07s/it] 20%|█▉        | 655/3309 [2:49:10<11:26:51, 15.53s/it] 20%|█▉        | 656/3309 [2:49:27<11:36:28, 15.75s/it] 20%|█▉        | 657/3309 [2:49:44<11:55:59, 16.20s/it] 20%|█▉        | 658/3309 [2:50:00<11:56:34, 16.22s/it] 20%|█▉        | 659/3309 [2:50:16<11:57:05, 16.24s/it] 20%|█▉        | 660/3309 [2:50:31<11:31:27, 15.66s/it]                                                       {'loss': 3.1881, 'grad_norm': 26.411352157592773, 'learning_rate': 9.26722399675745e-06, 'epoch': 0.2}
+ 20%|█▉        | 660/3309 [2:50:31<11:31:27, 15.66s/it] 20%|█▉        | 661/3309 [2:50:47<11:43:56, 15.95s/it] 20%|██        | 662/3309 [2:51:04<11:56:28, 16.24s/it] 20%|██        | 663/3309 [2:51:21<11:57:57, 16.28s/it] 20%|██        | 664/3309 [2:51:35<11:30:17, 15.66s/it] 20%|██        | 665/3309 [2:51:51<11:39:51, 15.88s/it] 20%|██        | 666/3309 [2:52:07<11:44:58, 16.00s/it] 20%|██        | 667/3309 [2:52:22<11:25:32, 15.57s/it] 20%|██        | 668/3309 [2:52:38<11:34:44, 15.78s/it] 20%|██        | 669/3309 [2:52:53<11:17:55, 15.41s/it] 20%|██        | 670/3309 [2:53:07<11:01:48, 15.05s/it]                                                       {'loss': 3.9177, 'grad_norm': 22.39121437072754, 'learning_rate': 9.24150814333732e-06, 'epoch': 0.2}
+ 20%|██        | 670/3309 [2:53:07<11:01:48, 15.05s/it] 20%|██        | 671/3309 [2:53:21<10:50:07, 14.79s/it] 20%|██        | 672/3309 [2:53:38<11:14:01, 15.34s/it] 20%|██        | 673/3309 [2:53:52<11:03:43, 15.11s/it] 20%|██        | 674/3309 [2:54:07<10:57:31, 14.97s/it] 20%|██        | 675/3309 [2:54:22<10:53:30, 14.89s/it] 20%|██        | 676/3309 [2:54:36<10:46:20, 14.73s/it] 20%|██        | 677/3309 [2:54:53<11:12:14, 15.32s/it] 20%|██        | 678/3309 [2:55:09<11:28:50, 15.71s/it] 21%|██        | 679/3309 [2:55:24<11:08:43, 15.26s/it] 21%|██        | 680/3309 [2:55:38<10:54:38, 14.94s/it]                                                       {'loss': 6.2124, 'grad_norm': 21.436046600341797, 'learning_rate': 9.215385774381395e-06, 'epoch': 0.21}
+ 21%|██        | 680/3309 [2:55:38<10:54:38, 14.94s/it] 21%|██        | 681/3309 [2:55:56<11:40:18, 15.99s/it] 21%|██        | 682/3309 [2:56:13<11:44:14, 16.08s/it] 21%|██        | 683/3309 [2:56:29<11:47:28, 16.16s/it] 21%|██        | 684/3309 [2:56:46<11:55:32, 16.36s/it] 21%|██        | 685/3309 [2:57:02<11:59:22, 16.45s/it] 21%|██        | 686/3309 [2:57:19<11:57:44, 16.42s/it] 21%|██        | 687/3309 [2:57:35<11:51:59, 16.29s/it] 21%|██        | 688/3309 [2:57:51<11:52:08, 16.30s/it] 21%|██        | 689/3309 [2:58:06<11:29:44, 15.80s/it] 21%|██        | 690/3309 [2:58:20<11:12:01, 15.40s/it]                                                       {'loss': 4.863, 'grad_norm': 42.19996643066406, 'learning_rate': 9.188859393515382e-06, 'epoch': 0.21}
+ 21%|██        | 690/3309 [2:58:20<11:12:01, 15.40s/it] 21%|██        | 691/3309 [2:58:37<11:33:45, 15.90s/it] 21%|██        | 692/3309 [2:58:52<11:16:50, 15.52s/it] 21%|██        | 693/3309 [2:59:06<11:03:00, 15.21s/it] 21%|██        | 694/3309 [2:59:21<10:50:41, 14.93s/it] 21%|██        | 695/3309 [2:59:37<11:09:13, 15.36s/it] 21%|██        | 696/3309 [2:59:51<10:56:44, 15.08s/it] 21%|██        | 697/3309 [3:00:06<10:44:43, 14.81s/it] 21%|██        | 698/3309 [3:00:20<10:42:25, 14.76s/it] 21%|██        | 699/3309 [3:00:34<10:35:37, 14.61s/it] 21%|██        | 700/3309 [3:00:51<11:00:37, 15.19s/it]                                                       {'loss': 6.0562, 'grad_norm': 24.43948745727539, 'learning_rate': 9.16193154308638e-06, 'epoch': 0.21}
+ 21%|██        | 700/3309 [3:00:51<11:00:37, 15.19s/it] 21%|██        | 701/3309 [3:01:06<10:52:38, 15.01s/it] 21%|██        | 702/3309 [3:01:22<11:10:15, 15.43s/it] 21%|██        | 703/3309 [3:01:36<10:54:54, 15.08s/it] 21%|██▏       | 704/3309 [3:01:51<10:43:35, 14.82s/it] 21%|██▏       | 705/3309 [3:02:07<11:06:46, 15.36s/it] 21%|██▏       | 706/3309 [3:02:22<10:58:11, 15.17s/it] 21%|██▏       | 707/3309 [3:02:37<10:51:15, 15.02s/it] 21%|██▏       | 708/3309 [3:02:53<11:12:12, 15.51s/it] 21%|██▏       | 709/3309 [3:03:07<10:54:56, 15.11s/it] 21%|██▏       | 710/3309 [3:03:22<10:49:40, 15.00s/it]                                                       {'loss': 6.1878, 'grad_norm': 36.5896110534668, 'learning_rate': 9.13460480391922e-06, 'epoch': 0.21}
+ 21%|██▏       | 710/3309 [3:03:22<10:49:40, 15.00s/it] 21%|██▏       | 711/3309 [3:03:36<10:40:20, 14.79s/it] 22%|██▏       | 712/3309 [3:03:50<10:28:58, 14.53s/it] 22%|██▏       | 713/3309 [3:04:07<10:55:25, 15.15s/it] 22%|██▏       | 714/3309 [3:04:23<11:10:10, 15.50s/it] 22%|██▏       | 715/3309 [3:04:38<10:55:43, 15.17s/it] 22%|██▏       | 716/3309 [3:04:52<10:45:49, 14.94s/it] 22%|██▏       | 717/3309 [3:05:07<10:39:38, 14.81s/it] 22%|██▏       | 718/3309 [3:05:21<10:32:18, 14.64s/it] 22%|██▏       | 719/3309 [3:05:37<10:54:26, 15.16s/it] 22%|██▏       | 720/3309 [3:05:52<10:47:33, 15.01s/it]                                                       {'loss': 6.4964, 'grad_norm': 39.19657897949219, 'learning_rate': 9.106881795069116e-06, 'epoch': 0.22}
+ 22%|██▏       | 720/3309 [3:05:52<10:47:33, 15.01s/it] 22%|██▏       | 721/3309 [3:06:08<11:04:30, 15.41s/it] 22%|██▏       | 722/3309 [3:06:25<11:16:37, 15.69s/it] 22%|██▏       | 723/3309 [3:06:41<11:25:06, 15.90s/it] 22%|██▏       | 724/3309 [3:06:57<11:30:56, 16.04s/it] 22%|██▏       | 725/3309 [3:07:12<11:07:45, 15.51s/it] 22%|██▏       | 726/3309 [3:07:26<10:50:59, 15.12s/it] 22%|██▏       | 727/3309 [3:07:42<11:06:25, 15.49s/it] 22%|██▏       | 728/3309 [3:07:59<11:25:08, 15.93s/it] 22%|██▏       | 729/3309 [3:08:16<11:34:28, 16.15s/it] 22%|██▏       | 730/3309 [3:08:32<11:36:42, 16.21s/it]                                                       {'loss': 3.1914, 'grad_norm': 19.438859939575195, 'learning_rate': 9.078765173570649e-06, 'epoch': 0.22}
+ 22%|██▏       | 730/3309 [3:08:32<11:36:42, 16.21s/it] 22%|██▏       | 731/3309 [3:08:48<11:38:21, 16.25s/it] 22%|██▏       | 732/3309 [3:09:03<11:16:31, 15.75s/it] 22%|██▏       | 733/3309 [3:09:19<11:23:25, 15.92s/it] 22%|██▏       | 734/3309 [3:09:36<11:28:10, 16.04s/it] 22%|██▏       | 735/3309 [3:09:52<11:31:39, 16.12s/it] 22%|██▏       | 736/3309 [3:10:08<11:34:17, 16.19s/it] 22%|██▏       | 737/3309 [3:10:25<11:40:06, 16.33s/it] 22%|██▏       | 738/3309 [3:10:41<11:39:10, 16.32s/it] 22%|██▏       | 739/3309 [3:10:55<11:12:09, 15.69s/it] 22%|██▏       | 740/3309 [3:11:12<11:19:25, 15.87s/it]                                                       {'loss': 4.0543, 'grad_norm': 26.316898345947266, 'learning_rate': 9.0502576341831e-06, 'epoch': 0.22}
+ 22%|██▏       | 740/3309 [3:11:12<11:19:25, 15.87s/it] 22%|██▏       | 741/3309 [3:11:26<11:03:20, 15.50s/it] 22%|██▏       | 742/3309 [3:11:43<11:14:17, 15.76s/it] 22%|██▏       | 743/3309 [3:11:57<10:59:05, 15.41s/it] 22%|██▏       | 744/3309 [3:12:14<11:14:27, 15.78s/it] 23%|██▎       | 745/3309 [3:12:28<10:50:30, 15.22s/it] 23%|██▎       | 746/3309 [3:12:42<10:42:13, 15.03s/it] 23%|██▎       | 747/3309 [3:12:59<10:59:15, 15.44s/it] 23%|██▎       | 748/3309 [3:13:15<11:11:28, 15.73s/it] 23%|██▎       | 749/3309 [3:13:32<11:22:22, 15.99s/it] 23%|██▎       | 750/3309 [3:13:46<11:00:19, 15.48s/it]                                                       {'loss': 5.4649, 'grad_norm': 21.5406436920166, 'learning_rate': 9.02136190913219e-06, 'epoch': 0.23}
+ 23%|██▎       | 750/3309 [3:13:46<11:00:19, 15.48s/it] 23%|██▎       | 751/3309 [3:14:03<11:11:16, 15.75s/it] 23%|██▎       | 752/3309 [3:14:19<11:19:29, 15.94s/it] 23%|██▎       | 753/3309 [3:14:35<11:23:22, 16.04s/it] 23%|██▎       | 754/3309 [3:14:52<11:31:25, 16.24s/it] 23%|██▎       | 755/3309 [3:15:09<11:35:38, 16.34s/it] 23%|██▎       | 756/3309 [3:15:25<11:35:20, 16.34s/it] 23%|██▎       | 757/3309 [3:15:41<11:35:21, 16.35s/it] 23%|██▎       | 758/3309 [3:15:56<11:13:19, 15.84s/it] 23%|██▎       | 759/3309 [3:16:13<11:23:30, 16.08s/it] 23%|██▎       | 760/3309 [3:16:27<11:04:44, 15.65s/it]                                                       {'loss': 4.6499, 'grad_norm': 38.014617919921875, 'learning_rate': 8.99208076784822e-06, 'epoch': 0.23}
+ 23%|██▎       | 760/3309 [3:16:27<11:04:44, 15.65s/it] 23%|██▎       | 761/3309 [3:16:43<11:13:31, 15.86s/it] 23%|██▎       | 762/3309 [3:17:00<11:18:41, 15.99s/it] 23%|██▎       | 763/3309 [3:17:18<11:44:31, 16.60s/it] 23%|██▎       | 764/3309 [3:17:34<11:40:35, 16.52s/it] 23%|██▎       | 765/3309 [3:17:48<11:11:22, 15.83s/it] 23%|██▎       | 766/3309 [3:18:03<10:50:04, 15.34s/it] 23%|██▎       | 767/3309 [3:18:17<10:39:17, 15.09s/it] 23%|██▎       | 768/3309 [3:18:31<10:28:57, 14.85s/it] 23%|██▎       | 769/3309 [3:18:48<10:48:39, 15.32s/it] 23%|██▎       | 770/3309 [3:19:04<11:01:46, 15.64s/it]                                                       {'loss': 3.0368, 'grad_norm': 16.046876907348633, 'learning_rate': 8.962417016700624e-06, 'epoch': 0.23}
+ 23%|██▎       | 770/3309 [3:19:04<11:01:46, 15.64s/it] 23%|██▎       | 771/3309 [3:19:21<11:10:50, 15.86s/it] 23%|██▎       | 772/3309 [3:19:35<10:49:59, 15.37s/it] 23%|██▎       | 773/3309 [3:19:49<10:35:29, 15.04s/it] 23%|██▎       | 774/3309 [3:20:04<10:28:26, 14.87s/it] 23%|██▎       | 775/3309 [3:20:21<11:00:19, 15.64s/it] 23%|██▎       | 776/3309 [3:20:37<11:09:17, 15.85s/it] 23%|██▎       | 777/3309 [3:20:52<10:53:33, 15.49s/it] 24%|██▎       | 778/3309 [3:21:06<10:37:33, 15.11s/it] 24%|██▎       | 779/3309 [3:21:23<10:52:54, 15.48s/it] 24%|██▎       | 780/3309 [3:21:37<10:38:37, 15.15s/it]                                                       {'loss': 4.6374, 'grad_norm': 25.170169830322266, 'learning_rate': 8.932373498729026e-06, 'epoch': 0.24}
+ 24%|██▎       | 780/3309 [3:21:37<10:38:37, 15.15s/it] 24%|██▎       | 781/3309 [3:21:53<10:49:14, 15.41s/it] 24%|██▎       | 782/3309 [3:22:09<10:55:45, 15.57s/it] 24%|██▎       | 783/3309 [3:22:23<10:38:01, 15.15s/it] 24%|██▎       | 784/3309 [3:22:39<10:51:19, 15.48s/it] 24%|██▎       | 785/3309 [3:22:54<10:37:46, 15.16s/it] 24%|██▍       | 786/3309 [3:23:10<10:52:14, 15.51s/it] 24%|██▍       | 787/3309 [3:23:27<11:05:51, 15.84s/it] 24%|██▍       | 788/3309 [3:23:41<10:41:22, 15.26s/it] 24%|██▍       | 789/3309 [3:23:57<10:57:12, 15.65s/it] 24%|██▍       | 790/3309 [3:24:12<10:42:49, 15.31s/it]                                                       {'loss': 4.0344, 'grad_norm': 28.294591903686523, 'learning_rate': 8.901953093370734e-06, 'epoch': 0.24}
+ 24%|██▍       | 790/3309 [3:24:12<10:42:49, 15.31s/it] 24%|██▍       | 791/3309 [3:24:28<10:59:18, 15.71s/it] 24%|██▍       | 792/3309 [3:24:45<11:10:33, 15.98s/it] 24%|██▍       | 793/3309 [3:24:59<10:49:08, 15.48s/it] 24%|██▍       | 794/3309 [3:25:16<11:03:48, 15.84s/it] 24%|██▍       | 795/3309 [3:25:32<11:09:14, 15.97s/it] 24%|██▍       | 796/3309 [3:25:48<11:12:43, 16.06s/it] 24%|██▍       | 797/3309 [3:26:03<10:49:59, 15.53s/it] 24%|██▍       | 798/3309 [3:26:19<10:58:59, 15.75s/it] 24%|██▍       | 799/3309 [3:26:33<10:43:26, 15.38s/it] 24%|██▍       | 800/3309 [3:26:50<10:58:30, 15.75s/it]                                                       {'loss': 3.9153, 'grad_norm': 25.618423461914062, 'learning_rate': 8.871158716184784e-06, 'epoch': 0.24}
+ 24%|██▍       | 800/3309 [3:26:50<10:58:30, 15.75s/it] 24%|██▍       | 801/3309 [3:27:07<11:09:08, 16.01s/it] 24%|██▍       | 802/3309 [3:27:21<10:52:03, 15.61s/it] 24%|██▍       | 803/3309 [3:27:38<11:01:27, 15.84s/it] 24%|██▍       | 804/3309 [3:27:54<11:06:12, 15.96s/it] 24%|██▍       | 805/3309 [3:28:11<11:18:27, 16.26s/it] 24%|██▍       | 806/3309 [3:28:27<11:18:28, 16.26s/it] 24%|██▍       | 807/3309 [3:28:44<11:23:12, 16.38s/it] 24%|██▍       | 808/3309 [3:29:03<11:55:39, 17.17s/it] 24%|██▍       | 809/3309 [3:29:19<11:45:07, 16.92s/it] 24%|██▍       | 810/3309 [3:29:33<11:10:13, 16.09s/it]                                                       {'loss': 4.852, 'grad_norm': 33.044132232666016, 'learning_rate': 8.839993318572497e-06, 'epoch': 0.24}
+ 24%|██▍       | 810/3309 [3:29:33<11:10:13, 16.09s/it] 25%|██▍       | 811/3309 [3:29:47<10:42:48, 15.44s/it] 25%|██▍       | 812/3309 [3:30:02<10:27:13, 15.07s/it] 25%|██▍       | 813/3309 [3:30:18<10:41:25, 15.42s/it] 25%|██▍       | 814/3309 [3:30:32<10:23:17, 14.99s/it] 25%|██▍       | 815/3309 [3:30:48<10:43:18, 15.48s/it] 25%|██▍       | 816/3309 [3:31:05<10:57:36, 15.83s/it] 25%|██▍       | 817/3309 [3:31:21<11:03:53, 15.98s/it] 25%|██▍       | 818/3309 [3:31:36<10:41:48, 15.46s/it] 25%|██▍       | 819/3309 [3:31:52<10:56:14, 15.81s/it] 25%|██▍       | 820/3309 [3:32:09<11:06:38, 16.07s/it]                                                       {'loss': 3.0679, 'grad_norm': 19.522127151489258, 'learning_rate': 8.808459887494617e-06, 'epoch': 0.25}
+ 25%|██▍       | 820/3309 [3:32:09<11:06:38, 16.07s/it] 25%|██▍       | 821/3309 [3:32:25<11:09:44, 16.15s/it] 25%|██▍       | 822/3309 [3:32:39<10:45:21, 15.57s/it] 25%|██▍       | 823/3309 [3:32:56<10:55:25, 15.82s/it] 25%|██▍       | 824/3309 [3:33:12<11:01:40, 15.98s/it] 25%|██▍       | 825/3309 [3:33:27<10:43:04, 15.53s/it] 25%|██▍       | 826/3309 [3:33:41<10:26:11, 15.13s/it] 25%|██▍       | 827/3309 [3:33:57<10:40:33, 15.48s/it] 25%|██▌       | 828/3309 [3:34:12<10:30:02, 15.24s/it] 25%|██▌       | 829/3309 [3:34:28<10:47:32, 15.67s/it] 25%|██▌       | 830/3309 [3:34:47<11:25:14, 16.59s/it]                                                       {'loss': 3.832, 'grad_norm': 17.915157318115234, 'learning_rate': 8.77656144518502e-06, 'epoch': 0.25}
+ 25%|██▌       | 830/3309 [3:34:47<11:25:14, 16.59s/it] 25%|██▌       | 831/3309 [3:35:04<11:21:58, 16.51s/it] 25%|██▌       | 832/3309 [3:35:18<10:53:50, 15.84s/it] 25%|██▌       | 833/3309 [3:35:34<10:59:47, 15.99s/it] 25%|██▌       | 834/3309 [3:35:51<11:03:50, 16.09s/it] 25%|██▌       | 835/3309 [3:36:07<11:07:01, 16.18s/it] 25%|██▌       | 836/3309 [3:36:21<10:42:02, 15.58s/it] 25%|██▌       | 837/3309 [3:36:37<10:50:49, 15.80s/it] 25%|██▌       | 838/3309 [3:36:54<10:57:55, 15.98s/it] 25%|██▌       | 839/3309 [3:37:10<11:00:51, 16.05s/it] 25%|██▌       | 840/3309 [3:37:27<11:07:56, 16.23s/it]                                                       {'loss': 2.9134, 'grad_norm': 18.468053817749023, 'learning_rate': 8.744301048861083e-06, 'epoch': 0.25}
+ 25%|██▌       | 840/3309 [3:37:27<11:07:56, 16.23s/it] 25%|██▌       | 841/3309 [3:37:45<11:37:48, 16.96s/it] 25%|██▌       | 842/3309 [3:38:02<11:29:50, 16.78s/it] 25%|██▌       | 843/3309 [3:38:18<11:22:47, 16.61s/it] 26%|██▌       | 844/3309 [3:38:37<11:48:31, 17.25s/it] 26%|██▌       | 845/3309 [3:38:51<11:10:33, 16.33s/it] 26%|██▌       | 846/3309 [3:39:07<11:11:05, 16.35s/it] 26%|██▌       | 847/3309 [3:39:21<10:44:26, 15.71s/it] 26%|██▌       | 848/3309 [3:39:38<10:51:18, 15.88s/it] 26%|██▌       | 849/3309 [3:39:54<10:56:14, 16.01s/it] 26%|██▌       | 850/3309 [3:40:11<11:03:08, 16.18s/it]                                                       {'loss': 2.9987, 'grad_norm': 25.19109535217285, 'learning_rate': 8.711681790430646e-06, 'epoch': 0.26}
+ 26%|██▌       | 850/3309 [3:40:11<11:03:08, 16.18s/it] 26%|██▌       | 851/3309 [3:40:29<11:33:45, 16.93s/it] 26%|██▌       | 852/3309 [3:40:44<11:05:01, 16.24s/it] 26%|██▌       | 853/3309 [3:41:00<11:05:53, 16.27s/it] 26%|██▌       | 854/3309 [3:41:14<10:40:01, 15.64s/it] 26%|██▌       | 855/3309 [3:41:31<10:52:01, 15.94s/it] 26%|██▌       | 856/3309 [3:41:50<11:26:29, 16.79s/it] 26%|██▌       | 857/3309 [3:42:04<10:54:45, 16.02s/it] 26%|██▌       | 858/3309 [3:42:19<10:37:20, 15.60s/it] 26%|██▌       | 859/3309 [3:42:35<10:44:48, 15.79s/it] 26%|██▌       | 860/3309 [3:42:51<10:50:45, 15.94s/it]                                                       {'loss': 4.7592, 'grad_norm': 27.227184295654297, 'learning_rate': 8.678706796195694e-06, 'epoch': 0.26}
+ 26%|██▌       | 860/3309 [3:42:51<10:50:45, 15.94s/it] 26%|██▌       | 861/3309 [3:43:07<10:54:52, 16.05s/it] 26%|██▌       | 862/3309 [3:43:22<10:32:04, 15.50s/it] 26%|██▌       | 863/3309 [3:43:38<10:44:19, 15.81s/it] 26%|██▌       | 864/3309 [3:43:54<10:48:51, 15.92s/it] 26%|██▌       | 865/3309 [3:44:08<10:23:56, 15.32s/it] 26%|██▌       | 866/3309 [3:44:22<10:06:40, 14.90s/it] 26%|██▌       | 867/3309 [3:44:37<10:01:47, 14.79s/it] 26%|██▌       | 868/3309 [3:44:53<10:19:49, 15.24s/it] 26%|██▋       | 869/3309 [3:45:09<10:32:51, 15.56s/it] 26%|██▋       | 870/3309 [3:45:24<10:16:00, 15.15s/it]                                                       {'loss': 3.7402, 'grad_norm': 28.04375457763672, 'learning_rate': 8.645379226552712e-06, 'epoch': 0.26}
+ 26%|██▋       | 870/3309 [3:45:24<10:16:00, 15.15s/it] 26%|██▋       | 871/3309 [3:45:40<10:30:44, 15.52s/it] 26%|██▋       | 872/3309 [3:45:54<10:14:51, 15.14s/it] 26%|██▋       | 873/3309 [3:46:08<10:03:02, 14.85s/it] 26%|██▋       | 874/3309 [3:46:25<10:21:22, 15.31s/it] 26%|██▋       | 875/3309 [3:46:39<10:10:18, 15.04s/it] 26%|██▋       | 876/3309 [3:46:54<10:05:53, 14.94s/it] 27%|██▋       | 877/3309 [3:47:08<9:57:06, 14.73s/it]  27%|██▋       | 878/3309 [3:47:25<10:19:49, 15.30s/it] 27%|██▋       | 879/3309 [3:47:39<10:06:31, 14.98s/it] 27%|██▋       | 880/3309 [3:47:55<10:22:02, 15.37s/it]                                                       {'loss': 4.6756, 'grad_norm': 21.457616806030273, 'learning_rate': 8.611702275689805e-06, 'epoch': 0.27}
+ 27%|██▋       | 880/3309 [3:47:55<10:22:02, 15.37s/it] 27%|██▋       | 881/3309 [3:48:12<10:33:21, 15.65s/it] 27%|██▋       | 882/3309 [3:48:26<10:19:38, 15.32s/it] 27%|██▋       | 883/3309 [3:48:42<10:30:18, 15.59s/it] 27%|██▋       | 884/3309 [3:48:59<10:41:59, 15.88s/it] 27%|██▋       | 885/3309 [3:49:15<10:46:41, 16.01s/it] 27%|██▋       | 886/3309 [3:49:31<10:49:06, 16.07s/it] 27%|██▋       | 887/3309 [3:49:48<10:55:37, 16.24s/it] 27%|██▋       | 888/3309 [3:50:05<11:00:27, 16.37s/it] 27%|██▋       | 889/3309 [3:50:21<10:57:54, 16.31s/it] 27%|██▋       | 890/3309 [3:50:36<10:38:04, 15.83s/it]                                                       {'loss': 4.5315, 'grad_norm': 35.01508331298828, 'learning_rate': 8.577679171280538e-06, 'epoch': 0.27}
+ 27%|██▋       | 890/3309 [3:50:36<10:38:04, 15.83s/it] 27%|██▋       | 891/3309 [3:50:52<10:47:19, 16.06s/it] 27%|██▋       | 892/3309 [3:51:09<10:49:42, 16.13s/it] 27%|██▋       | 893/3309 [3:51:23<10:26:06, 15.55s/it] 27%|██▋       | 894/3309 [3:51:39<10:38:23, 15.86s/it] 27%|██▋       | 895/3309 [3:51:54<10:22:04, 15.46s/it] 27%|██▋       | 896/3309 [3:52:08<10:05:09, 15.05s/it] 27%|██▋       | 897/3309 [3:52:22<9:56:21, 14.83s/it]  27%|██▋       | 898/3309 [3:52:39<10:13:58, 15.28s/it] 27%|██▋       | 899/3309 [3:52:53<10:06:10, 15.09s/it] 27%|██▋       | 900/3309 [3:53:10<10:24:37, 15.56s/it]                                                       {'loss': 5.2698, 'grad_norm': 20.160045623779297, 'learning_rate': 8.543313174174601e-06, 'epoch': 0.27}
+ 27%|██▋       | 900/3309 [3:53:10<10:24:37, 15.56s/it] 27%|██▋       | 901/3309 [3:53:25<10:13:35, 15.29s/it] 27%|██▋       | 902/3309 [3:53:39<10:00:16, 14.96s/it] 27%|██▋       | 903/3309 [3:53:55<10:16:54, 15.38s/it] 27%|██▋       | 904/3309 [3:54:09<10:01:57, 15.02s/it] 27%|██▋       | 905/3309 [3:54:26<10:21:46, 15.52s/it] 27%|██▋       | 906/3309 [3:54:43<10:34:16, 15.84s/it] 27%|██▋       | 907/3309 [3:54:59<10:40:20, 16.00s/it] 27%|██▋       | 908/3309 [3:55:15<10:43:08, 16.07s/it] 27%|██▋       | 909/3309 [3:55:31<10:45:36, 16.14s/it] 28%|██▊       | 910/3309 [3:55:46<10:24:57, 15.63s/it]                                                       {'loss': 3.849, 'grad_norm': 22.52850341796875, 'learning_rate': 8.508607578085281e-06, 'epoch': 0.27}
+ 28%|██▊       | 910/3309 [3:55:46<10:24:57, 15.63s/it] 28%|██▊       | 911/3309 [3:56:03<10:37:00, 15.94s/it] 28%|██▊       | 912/3309 [3:56:17<10:21:58, 15.57s/it] 28%|██▊       | 913/3309 [3:56:31<10:02:02, 15.08s/it] 28%|██▊       | 914/3309 [3:56:45<9:51:46, 14.83s/it]  28%|██▊       | 915/3309 [3:57:02<10:08:47, 15.26s/it] 28%|██▊       | 916/3309 [3:57:18<10:20:58, 15.57s/it] 28%|██▊       | 917/3309 [3:57:34<10:28:47, 15.77s/it] 28%|██▊       | 918/3309 [3:57:49<10:18:40, 15.53s/it] 28%|██▊       | 919/3309 [3:58:06<10:28:45, 15.78s/it] 28%|██▊       | 920/3309 [3:58:22<10:39:07, 16.05s/it]                                                       {'loss': 3.8616, 'grad_norm': 21.895462036132812, 'learning_rate': 8.473565709273786e-06, 'epoch': 0.28}
+ 28%|██▊       | 920/3309 [3:58:22<10:39:07, 16.05s/it] 28%|██▊       | 921/3309 [3:58:36<10:16:48, 15.50s/it] 28%|██▊       | 922/3309 [3:58:53<10:25:39, 15.73s/it] 28%|██▊       | 923/3309 [3:59:09<10:32:25, 15.90s/it] 28%|██▊       | 924/3309 [3:59:24<10:20:09, 15.60s/it] 28%|██▊       | 925/3309 [3:59:38<10:03:02, 15.18s/it] 28%|██▊       | 926/3309 [3:59:55<10:21:44, 15.65s/it] 28%|██▊       | 927/3309 [4:00:11<10:29:43, 15.86s/it] 28%|██▊       | 928/3309 [4:00:25<10:09:35, 15.36s/it] 28%|██▊       | 929/3309 [4:00:42<10:21:20, 15.66s/it] 28%|██▊       | 930/3309 [4:00:58<10:32:13, 15.95s/it]                                                       {'loss': 3.8386, 'grad_norm': 16.077316284179688, 'learning_rate': 8.438190926230439e-06, 'epoch': 0.28}
+ 28%|██▊       | 930/3309 [4:00:58<10:32:13, 15.95s/it] 28%|██▊       | 931/3309 [4:01:15<10:37:12, 16.08s/it] 28%|██▊       | 932/3309 [4:01:31<10:39:45, 16.15s/it] 28%|██▊       | 933/3309 [4:01:47<10:40:41, 16.18s/it] 28%|██▊       | 934/3309 [4:02:02<10:17:40, 15.60s/it] 28%|██▊       | 935/3309 [4:02:16<10:01:05, 15.19s/it] 28%|██▊       | 936/3309 [4:02:30<9:48:37, 14.88s/it]  28%|██▊       | 937/3309 [4:02:47<10:08:43, 15.40s/it] 28%|██▊       | 938/3309 [4:03:01<9:56:14, 15.09s/it]  28%|██▊       | 939/3309 [4:03:17<10:09:16, 15.42s/it] 28%|██▊       | 940/3309 [4:03:32<10:00:11, 15.20s/it]                                                       {'loss': 4.3994, 'grad_norm': 33.1984977722168, 'learning_rate': 8.40248661935281e-06, 'epoch': 0.28}
+ 28%|██▊       | 940/3309 [4:03:32<10:00:11, 15.20s/it] 28%|██▊       | 941/3309 [4:03:48<10:17:15, 15.64s/it] 28%|██▊       | 942/3309 [4:04:03<10:00:17, 15.22s/it] 28%|██▊       | 943/3309 [4:04:17<9:48:49, 14.93s/it]  29%|██▊       | 944/3309 [4:04:31<9:39:49, 14.71s/it] 29%|██▊       | 945/3309 [4:04:48<9:58:53, 15.20s/it] 29%|██▊       | 946/3309 [4:05:04<10:16:17, 15.65s/it] 29%|██▊       | 947/3309 [4:05:20<10:22:55, 15.82s/it] 29%|██▊       | 948/3309 [4:05:37<10:29:16, 15.99s/it] 29%|██▊       | 949/3309 [4:05:53<10:35:33, 16.16s/it] 29%|██▊       | 950/3309 [4:06:10<10:40:49, 16.30s/it]                                                       {'loss': 3.1029, 'grad_norm': 27.1571102142334, 'learning_rate': 8.366456210620756e-06, 'epoch': 0.29}
+ 29%|██▊       | 950/3309 [4:06:10<10:40:49, 16.30s/it] 29%|██▊       | 951/3309 [4:06:26<10:41:46, 16.33s/it] 29%|██▉       | 952/3309 [4:06:43<10:41:28, 16.33s/it] 29%|██▉       | 953/3309 [4:06:57<10:20:52, 15.81s/it] 29%|██▉       | 954/3309 [4:07:14<10:25:29, 15.94s/it] 29%|██▉       | 955/3309 [4:07:30<10:29:50, 16.05s/it] 29%|██▉       | 956/3309 [4:07:44<10:11:04, 15.58s/it] 29%|██▉       | 957/3309 [4:08:01<10:22:30, 15.88s/it] 29%|██▉       | 958/3309 [4:08:18<10:31:48, 16.12s/it] 29%|██▉       | 959/3309 [4:08:32<10:09:13, 15.55s/it] 29%|██▉       | 960/3309 [4:08:48<10:17:04, 15.76s/it]                                                       {'loss': 3.7567, 'grad_norm': 31.706750869750977, 'learning_rate': 8.330103153268464e-06, 'epoch': 0.29}
+ 29%|██▉       | 960/3309 [4:08:48<10:17:04, 15.76s/it] 29%|██▉       | 961/3309 [4:09:07<10:51:22, 16.65s/it] 29%|██▉       | 962/3309 [4:09:23<10:47:12, 16.55s/it] 29%|██▉       | 963/3309 [4:09:38<10:24:23, 15.97s/it] 29%|██▉       | 964/3309 [4:09:52<10:00:01, 15.35s/it] 29%|██▉       | 965/3309 [4:10:06<9:46:01, 15.00s/it]  29%|██▉       | 966/3309 [4:10:22<10:01:55, 15.41s/it] 29%|██▉       | 967/3309 [4:10:39<10:12:53, 15.70s/it] 29%|██▉       | 968/3309 [4:10:53<9:54:23, 15.23s/it]  29%|██▉       | 969/3309 [4:11:09<10:07:31, 15.58s/it] 29%|██▉       | 970/3309 [4:11:26<10:19:25, 15.89s/it]                                                       {'loss': 3.6988, 'grad_norm': 24.30504608154297, 'learning_rate': 8.29343093145347e-06, 'epoch': 0.29}
+ 29%|██▉       | 970/3309 [4:11:26<10:19:25, 15.89s/it] 29%|██▉       | 971/3309 [4:11:42<10:23:05, 15.99s/it] 29%|██▉       | 972/3309 [4:11:58<10:27:02, 16.10s/it] 29%|██▉       | 973/3309 [4:12:13<10:11:52, 15.72s/it] 29%|██▉       | 974/3309 [4:12:27<9:50:46, 15.18s/it]  29%|██▉       | 975/3309 [4:12:42<9:44:35, 15.03s/it] 29%|██▉       | 976/3309 [4:12:58<9:59:52, 15.43s/it] 30%|██▉       | 977/3309 [4:13:15<10:17:15, 15.88s/it] 30%|██▉       | 978/3309 [4:13:29<9:57:07, 15.37s/it]  30%|██▉       | 979/3309 [4:13:43<9:43:15, 15.02s/it] 30%|██▉       | 980/3309 [4:14:00<9:57:19, 15.39s/it]                                                      {'loss': 3.6097, 'grad_norm': 24.231523513793945, 'learning_rate': 8.25644305992275e-06, 'epoch': 0.3}
+ 30%|██▉       | 980/3309 [4:14:00<9:57:19, 15.39s/it] 30%|██▉       | 981/3309 [4:14:16<10:08:55, 15.69s/it] 30%|██▉       | 982/3309 [4:14:31<10:02:47, 15.54s/it] 30%|██▉       | 983/3309 [4:14:48<10:17:43, 15.93s/it] 30%|██▉       | 984/3309 [4:15:02<9:54:10, 15.33s/it]  30%|██▉       | 985/3309 [4:15:16<9:41:50, 15.02s/it] 30%|██▉       | 986/3309 [4:15:33<9:59:56, 15.50s/it] 30%|██▉       | 987/3309 [4:15:49<10:08:43, 15.73s/it] 30%|██▉       | 988/3309 [4:16:04<10:00:51, 15.53s/it] 30%|██▉       | 989/3309 [4:16:21<10:10:53, 15.80s/it] 30%|██▉       | 990/3309 [4:16:35<9:52:52, 15.34s/it]                                                       {'loss': 4.5566, 'grad_norm': 19.621383666992188, 'learning_rate': 8.21914308367584e-06, 'epoch': 0.3}
+ 30%|██▉       | 990/3309 [4:16:35<9:52:52, 15.34s/it] 30%|██▉       | 991/3309 [4:16:52<10:06:56, 15.71s/it] 30%|██▉       | 992/3309 [4:17:08<10:13:19, 15.88s/it] 30%|███       | 993/3309 [4:17:24<10:17:47, 16.00s/it] 30%|███       | 994/3309 [4:17:40<10:20:55, 16.09s/it] 30%|███       | 995/3309 [4:17:57<10:22:50, 16.15s/it] 30%|███       | 996/3309 [4:18:11<9:59:25, 15.55s/it]  30%|███       | 997/3309 [4:18:25<9:46:48, 15.23s/it] 30%|███       | 998/3309 [4:18:42<9:59:05, 15.55s/it] 30%|███       | 999/3309 [4:18:56<9:43:35, 15.16s/it] 30%|███       | 1000/3309 [4:19:13<10:00:54, 15.61s/it]                                                        {'loss': 3.7714, 'grad_norm': 21.627859115600586, 'learning_rate': 8.181534577625088e-06, 'epoch': 0.3}
+ 30%|███       | 1000/3309 [4:19:13<10:00:54, 15.61s/it]/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+ 30%|███       | 1001/3309 [4:20:13<18:40:06, 29.12s/it] 30%|███       | 1002/3309 [4:20:27<15:47:47, 24.65s/it] 30%|███       | 1003/3309 [4:20:42<13:50:24, 21.61s/it] 30%|███       | 1004/3309 [4:20:57<12:31:45, 19.57s/it] 30%|███       | 1005/3309 [4:21:11<11:29:40, 17.96s/it] 30%|███       | 1006/3309 [4:21:25<10:46:18, 16.84s/it] 30%|███       | 1007/3309 [4:21:41<10:39:47, 16.68s/it] 30%|███       | 1008/3309 [4:21:56<10:14:47, 16.03s/it] 30%|███       | 1009/3309 [4:22:12<10:17:55, 16.12s/it] 31%|███       | 1010/3309 [4:22:27<9:55:54, 15.55s/it]                                                        {'loss': 4.6373, 'grad_norm': 14.206421852111816, 'learning_rate': 8.143621146253022e-06, 'epoch': 0.31}
+ 31%|███       | 1010/3309 [4:22:27<9:55:54, 15.55s/it] 31%|███       | 1011/3309 [4:22:41<9:42:29, 15.21s/it] 31%|███       | 1012/3309 [4:22:55<9:32:31, 14.95s/it] 31%|███       | 1013/3309 [4:23:12<9:51:24, 15.45s/it] 31%|███       | 1014/3309 [4:23:28<10:01:01, 15.71s/it] 31%|███       | 1015/3309 [4:23:43<9:43:51, 15.27s/it]  31%|███       | 1016/3309 [4:23:59<9:59:45, 15.69s/it] 31%|███       | 1017/3309 [4:24:15<10:05:53, 15.86s/it] 31%|███       | 1018/3309 [4:24:30<9:47:19, 15.38s/it]  31%|███       | 1019/3309 [4:24:46<9:59:08, 15.70s/it] 31%|███       | 1020/3309 [4:25:03<10:10:08, 15.99s/it]                                                        {'loss': 4.6538, 'grad_norm': 27.084983825683594, 'learning_rate': 8.105406423266884e-06, 'epoch': 0.31}
+ 31%|███       | 1020/3309 [4:25:03<10:10:08, 15.99s/it] 31%|███       | 1021/3309 [4:25:19<10:13:36, 16.09s/it] 31%|███       | 1022/3309 [4:25:34<9:55:13, 15.62s/it]  31%|███       | 1023/3309 [4:25:48<9:39:16, 15.20s/it] 31%|███       | 1024/3309 [4:26:04<9:52:32, 15.56s/it] 31%|███       | 1025/3309 [4:26:19<9:41:28, 15.28s/it] 31%|███       | 1026/3309 [4:26:33<9:32:19, 15.04s/it] 31%|███       | 1027/3309 [4:26:48<9:22:29, 14.79s/it] 31%|███       | 1028/3309 [4:27:04<9:39:44, 15.25s/it] 31%|███       | 1029/3309 [4:27:20<9:51:22, 15.56s/it] 31%|███       | 1030/3309 [4:27:35<9:39:27, 15.26s/it]                                                       {'loss': 4.4614, 'grad_norm': 20.950910568237305, 'learning_rate': 8.066894071250374e-06, 'epoch': 0.31}
+ 31%|███       | 1030/3309 [4:27:35<9:39:27, 15.26s/it] 31%|███       | 1031/3309 [4:27:51<9:51:39, 15.58s/it] 31%|███       | 1032/3309 [4:28:05<9:35:47, 15.17s/it] 31%|███       | 1033/3309 [4:28:19<9:24:25, 14.88s/it] 31%|███       | 1034/3309 [4:28:36<9:41:21, 15.33s/it] 31%|███▏      | 1035/3309 [4:28:50<9:30:40, 15.06s/it] 31%|███▏      | 1036/3309 [4:29:07<9:45:34, 15.46s/it] 31%|███▏      | 1037/3309 [4:29:21<9:30:59, 15.08s/it] 31%|███▏      | 1038/3309 [4:29:35<9:20:23, 14.81s/it] 31%|███▏      | 1039/3309 [4:29:51<9:37:31, 15.26s/it] 31%|███▏      | 1040/3309 [4:30:05<9:21:42, 14.85s/it]                                                       {'loss': 3.7694, 'grad_norm': 20.357742309570312, 'learning_rate': 8.02808778131262e-06, 'epoch': 0.31}
+ 31%|███▏      | 1040/3309 [4:30:05<9:21:42, 14.85s/it] 31%|███▏      | 1041/3309 [4:30:20<9:14:23, 14.67s/it] 31%|███▏      | 1042/3309 [4:30:33<9:05:45, 14.44s/it] 32%|███▏      | 1043/3309 [4:30:48<9:05:22, 14.44s/it] 32%|███▏      | 1044/3309 [4:31:05<9:30:42, 15.12s/it] 32%|███▏      | 1045/3309 [4:31:21<9:40:03, 15.37s/it] 32%|███▏      | 1046/3309 [4:31:34<9:23:38, 14.94s/it] 32%|███▏      | 1047/3309 [4:31:51<9:39:42, 15.38s/it] 32%|███▏      | 1048/3309 [4:32:05<9:30:03, 15.13s/it] 32%|███▏      | 1049/3309 [4:32:20<9:19:58, 14.87s/it] 32%|███▏      | 1050/3309 [4:32:36<9:35:56, 15.30s/it]                                                       {'loss': 4.4575, 'grad_norm': 18.685476303100586, 'learning_rate': 7.988991272734407e-06, 'epoch': 0.32}
+ 32%|███▏      | 1050/3309 [4:32:36<9:35:56, 15.30s/it] 32%|███▏      | 1051/3309 [4:32:51<9:28:00, 15.09s/it] 32%|███▏      | 1052/3309 [4:33:07<9:44:54, 15.55s/it] 32%|███▏      | 1053/3309 [4:33:22<9:32:29, 15.23s/it] 32%|███▏      | 1054/3309 [4:33:38<9:44:45, 15.56s/it] 32%|███▏      | 1055/3309 [4:33:52<9:29:29, 15.16s/it] 32%|███▏      | 1056/3309 [4:34:06<9:18:15, 14.87s/it] 32%|███▏      | 1057/3309 [4:34:23<9:34:24, 15.30s/it] 32%|███▏      | 1058/3309 [4:34:37<9:21:35, 14.97s/it] 32%|███▏      | 1059/3309 [4:34:51<9:12:54, 14.74s/it] 32%|███▏      | 1060/3309 [4:35:08<9:30:57, 15.23s/it]                                                       {'loss': 4.4394, 'grad_norm': 24.249338150024414, 'learning_rate': 7.94960829261172e-06, 'epoch': 0.32}
+ 32%|███▏      | 1060/3309 [4:35:08<9:30:57, 15.23s/it] 32%|███▏      | 1061/3309 [4:35:24<9:43:21, 15.57s/it] 32%|███▏      | 1062/3309 [4:35:38<9:29:52, 15.22s/it] 32%|███▏      | 1063/3309 [4:35:55<9:42:29, 15.56s/it] 32%|███▏      | 1064/3309 [4:36:11<9:51:12, 15.80s/it] 32%|███▏      | 1065/3309 [4:36:28<9:59:50, 16.04s/it] 32%|███▏      | 1066/3309 [4:36:44<10:05:22, 16.19s/it] 32%|███▏      | 1067/3309 [4:37:01<10:10:17, 16.33s/it] 32%|███▏      | 1068/3309 [4:37:17<10:09:55, 16.33s/it] 32%|███▏      | 1069/3309 [4:37:32<9:49:45, 15.80s/it]  32%|███▏      | 1070/3309 [4:37:46<9:34:39, 15.40s/it]                                                       {'loss': 4.7241, 'grad_norm': 22.846027374267578, 'learning_rate': 7.909942615496613e-06, 'epoch': 0.32}
+ 32%|███▏      | 1070/3309 [4:37:46<9:34:39, 15.40s/it] 32%|███▏      | 1071/3309 [4:38:02<9:43:45, 15.65s/it] 32%|███▏      | 1072/3309 [4:38:19<9:54:42, 15.95s/it] 32%|███▏      | 1073/3309 [4:38:33<9:31:47, 15.34s/it] 32%|███▏      | 1074/3309 [4:38:47<9:19:40, 15.02s/it] 32%|███▏      | 1075/3309 [4:39:02<9:14:35, 14.90s/it] 33%|███▎      | 1076/3309 [4:39:16<9:11:27, 14.82s/it] 33%|███▎      | 1077/3309 [4:39:31<9:04:13, 14.63s/it] 33%|███▎      | 1078/3309 [4:39:45<8:56:56, 14.44s/it] 33%|███▎      | 1079/3309 [4:40:01<9:17:33, 15.00s/it] 33%|███▎      | 1080/3309 [4:40:16<9:13:25, 14.90s/it]                                                       {'loss': 5.3999, 'grad_norm': 30.40308952331543, 'learning_rate': 7.869998043035442e-06, 'epoch': 0.33}
+ 33%|███▎      | 1080/3309 [4:40:16<9:13:25, 14.90s/it] 33%|███▎      | 1081/3309 [4:40:32<9:29:27, 15.34s/it] 33%|███▎      | 1082/3309 [4:40:48<9:39:55, 15.62s/it] 33%|███▎      | 1083/3309 [4:41:03<9:29:17, 15.34s/it] 33%|███▎      | 1084/3309 [4:41:20<9:43:14, 15.73s/it] 33%|███▎      | 1085/3309 [4:41:36<9:50:12, 15.92s/it] 33%|███▎      | 1086/3309 [4:41:51<9:36:25, 15.56s/it] 33%|███▎      | 1087/3309 [4:42:07<9:48:20, 15.89s/it] 33%|███▎      | 1088/3309 [4:42:22<9:29:45, 15.39s/it] 33%|███▎      | 1089/3309 [4:42:36<9:19:35, 15.12s/it] 33%|███▎      | 1090/3309 [4:42:50<9:09:02, 14.85s/it]                                                       {'loss': 5.0469, 'grad_norm': 17.647789001464844, 'learning_rate': 7.829778403604512e-06, 'epoch': 0.33}
+ 33%|███▎      | 1090/3309 [4:42:50<9:09:02, 14.85s/it] 33%|███▎      | 1091/3309 [4:43:05<9:06:50, 14.79s/it] 33%|███▎      | 1092/3309 [4:43:23<9:46:37, 15.88s/it] 33%|███▎      | 1093/3309 [4:43:38<9:32:20, 15.50s/it] 33%|███▎      | 1094/3309 [4:43:54<9:42:06, 15.77s/it] 33%|███▎      | 1095/3309 [4:44:09<9:25:07, 15.32s/it] 33%|███▎      | 1096/3309 [4:44:25<9:35:23, 15.60s/it] 33%|███▎      | 1097/3309 [4:44:42<9:46:33, 15.91s/it] 33%|███▎      | 1098/3309 [4:44:56<9:32:42, 15.54s/it] 33%|███▎      | 1099/3309 [4:45:10<9:17:40, 15.14s/it] 33%|███▎      | 1100/3309 [4:45:25<9:12:14, 15.00s/it]                                                       {'loss': 6.0896, 'grad_norm': 33.98617935180664, 'learning_rate': 7.789287551943158e-06, 'epoch': 0.33}
+ 33%|███▎      | 1100/3309 [4:45:25<9:12:14, 15.00s/it] 33%|███▎      | 1101/3309 [4:45:40<9:08:20, 14.90s/it] 33%|███▎      | 1102/3309 [4:45:56<9:24:00, 15.33s/it] 33%|███▎      | 1103/3309 [4:46:10<9:11:31, 15.00s/it] 33%|███▎      | 1104/3309 [4:46:27<9:25:56, 15.40s/it] 33%|███▎      | 1105/3309 [4:46:41<9:14:38, 15.10s/it] 33%|███▎      | 1106/3309 [4:46:57<9:27:00, 15.44s/it] 33%|███▎      | 1107/3309 [4:47:14<9:35:56, 15.69s/it] 33%|███▎      | 1108/3309 [4:47:28<9:19:36, 15.26s/it] 34%|███▎      | 1109/3309 [4:47:42<9:08:44, 14.97s/it] 34%|███▎      | 1110/3309 [4:47:56<9:00:06, 14.74s/it]                                                       {'loss': 4.5196, 'grad_norm': 21.646024703979492, 'learning_rate': 7.748529368784293e-06, 'epoch': 0.34}
+ 34%|███▎      | 1110/3309 [4:47:56<9:00:06, 14.74s/it] 34%|███▎      | 1111/3309 [4:48:11<8:59:16, 14.72s/it] 34%|███▎      | 1112/3309 [4:48:26<8:58:00, 14.69s/it] 34%|███▎      | 1113/3309 [4:48:40<8:49:14, 14.46s/it] 34%|███▎      | 1114/3309 [4:48:54<8:46:16, 14.39s/it] 34%|███▎      | 1115/3309 [4:49:08<8:46:21, 14.39s/it] 34%|███▎      | 1116/3309 [4:49:24<9:06:12, 14.94s/it] 34%|███▍      | 1117/3309 [4:49:39<9:03:19, 14.87s/it] 34%|███▍      | 1118/3309 [4:49:55<9:19:46, 15.33s/it] 34%|███▍      | 1119/3309 [4:50:12<9:30:34, 15.63s/it] 34%|███▍      | 1120/3309 [4:50:28<9:37:23, 15.83s/it]                                                       {'loss': 6.1607, 'grad_norm': 18.94881820678711, 'learning_rate': 7.707507760482473e-06, 'epoch': 0.34}
+ 34%|███▍      | 1120/3309 [4:50:28<9:37:23, 15.83s/it] 34%|███▍      | 1121/3309 [4:50:44<9:42:10, 15.96s/it] 34%|███▍      | 1122/3309 [4:50:59<9:22:34, 15.43s/it] 34%|███▍      | 1123/3309 [4:51:15<9:35:22, 15.79s/it] 34%|███▍      | 1124/3309 [4:51:32<9:44:30, 16.05s/it] 34%|███▍      | 1125/3309 [4:51:46<9:23:57, 15.49s/it] 34%|███▍      | 1126/3309 [4:52:02<9:32:39, 15.74s/it] 34%|███▍      | 1127/3309 [4:52:19<9:41:08, 15.98s/it] 34%|███▍      | 1128/3309 [4:52:34<9:26:25, 15.58s/it] 34%|███▍      | 1129/3309 [4:52:50<9:38:01, 15.91s/it] 34%|███▍      | 1130/3309 [4:53:07<9:42:23, 16.04s/it]                                                       {'loss': 3.7909, 'grad_norm': 18.058412551879883, 'learning_rate': 7.666226658639507e-06, 'epoch': 0.34}
+ 34%|███▍      | 1130/3309 [4:53:07<9:42:23, 16.04s/it] 34%|███▍      | 1131/3309 [4:53:23<9:45:47, 16.14s/it] 34%|███▍      | 1132/3309 [4:53:37<9:25:03, 15.57s/it] 34%|███▍      | 1133/3309 [4:53:51<9:09:41, 15.16s/it] 34%|███▍      | 1134/3309 [4:54:08<9:25:56, 15.61s/it] 34%|███▍      | 1135/3309 [4:54:24<9:33:08, 15.82s/it] 34%|███▍      | 1136/3309 [4:54:39<9:17:39, 15.40s/it] 34%|███▍      | 1137/3309 [4:54:57<9:53:05, 16.38s/it] 34%|███▍      | 1138/3309 [4:55:12<9:32:18, 15.82s/it] 34%|███▍      | 1139/3309 [4:55:28<9:37:49, 15.98s/it] 34%|███▍      | 1140/3309 [4:55:43<9:18:31, 15.45s/it]                                                       {'loss': 3.638, 'grad_norm': 22.541349411010742, 'learning_rate': 7.624690019727636e-06, 'epoch': 0.34}
+ 34%|███▍      | 1140/3309 [4:55:43<9:18:31, 15.45s/it] 34%|███▍      | 1141/3309 [4:55:59<9:27:04, 15.69s/it] 35%|███▍      | 1142/3309 [4:56:15<9:33:25, 15.88s/it] 35%|███▍      | 1143/3309 [4:56:30<9:19:39, 15.50s/it] 35%|███▍      | 1144/3309 [4:56:46<9:27:58, 15.74s/it] 35%|███▍      | 1145/3309 [4:57:01<9:14:29, 15.37s/it] 35%|███▍      | 1146/3309 [4:57:17<9:28:10, 15.76s/it] 35%|███▍      | 1147/3309 [4:57:31<9:11:44, 15.31s/it] 35%|███▍      | 1148/3309 [4:57:46<9:04:20, 15.11s/it] 35%|███▍      | 1149/3309 [4:58:02<9:16:49, 15.47s/it] 35%|███▍      | 1150/3309 [4:58:16<9:00:02, 15.01s/it]                                                       {'loss': 4.53, 'grad_norm': 23.882991790771484, 'learning_rate': 7.58290182471034e-06, 'epoch': 0.35}
+ 35%|███▍      | 1150/3309 [4:58:16<9:00:02, 15.01s/it] 35%|███▍      | 1151/3309 [4:58:33<9:14:13, 15.41s/it] 35%|███▍      | 1152/3309 [4:58:49<9:27:17, 15.78s/it] 35%|███▍      | 1153/3309 [4:59:06<9:33:59, 15.97s/it] 35%|███▍      | 1154/3309 [4:59:22<9:38:09, 16.10s/it] 35%|███▍      | 1155/3309 [4:59:39<9:43:50, 16.26s/it] 35%|███▍      | 1156/3309 [4:59:53<9:23:52, 15.71s/it] 35%|███▍      | 1157/3309 [5:00:07<9:07:46, 15.27s/it] 35%|███▍      | 1158/3309 [5:00:24<9:22:25, 15.69s/it] 35%|███▌      | 1159/3309 [5:00:41<9:29:39, 15.90s/it] 35%|███▌      | 1160/3309 [5:00:55<9:11:29, 15.40s/it]                                                       {'loss': 3.6987, 'grad_norm': 19.6879940032959, 'learning_rate': 7.5408660786607976e-06, 'epoch': 0.35}
+ 35%|███▌      | 1160/3309 [5:00:55<9:11:29, 15.40s/it] 35%|███▌      | 1161/3309 [5:01:11<9:21:14, 15.68s/it] 35%|███▌      | 1162/3309 [5:01:28<9:30:54, 15.95s/it] 35%|███▌      | 1163/3309 [5:01:42<9:11:40, 15.42s/it] 35%|███▌      | 1164/3309 [5:01:56<8:58:44, 15.07s/it] 35%|███▌      | 1165/3309 [5:02:10<8:49:35, 14.82s/it] 35%|███▌      | 1166/3309 [5:02:27<9:05:48, 15.28s/it] 35%|███▌      | 1167/3309 [5:02:41<8:51:41, 14.89s/it] 35%|███▌      | 1168/3309 [5:02:57<9:07:11, 15.33s/it] 35%|███▌      | 1169/3309 [5:03:13<9:14:26, 15.55s/it] 35%|███▌      | 1170/3309 [5:03:27<9:00:19, 15.16s/it]                                                       {'loss': 2.9513, 'grad_norm': 20.6401309967041, 'learning_rate': 7.498586810378019e-06, 'epoch': 0.35}
+ 35%|███▌      | 1170/3309 [5:03:27<9:00:19, 15.16s/it] 35%|███▌      | 1171/3309 [5:03:44<9:12:23, 15.50s/it] 35%|███▌      | 1172/3309 [5:04:00<9:21:43, 15.77s/it] 35%|███▌      | 1173/3309 [5:04:16<9:27:37, 15.94s/it] 35%|███▌      | 1174/3309 [5:04:33<9:34:40, 16.15s/it] 36%|███▌      | 1175/3309 [5:04:50<9:39:44, 16.30s/it] 36%|███▌      | 1176/3309 [5:05:04<9:14:06, 15.59s/it] 36%|███▌      | 1177/3309 [5:05:20<9:20:28, 15.77s/it] 36%|███▌      | 1178/3309 [5:05:34<9:03:08, 15.29s/it] 36%|███▌      | 1179/3309 [5:05:48<8:51:07, 14.96s/it] 36%|███▌      | 1180/3309 [5:06:05<9:09:14, 15.48s/it]                                                       {'loss': 2.8103, 'grad_norm': 22.658132553100586, 'learning_rate': 7.456068072000731e-06, 'epoch': 0.36}
+ 36%|███▌      | 1180/3309 [5:06:05<9:09:14, 15.48s/it] 36%|███▌      | 1181/3309 [5:06:19<8:59:31, 15.21s/it] 36%|███▌      | 1182/3309 [5:06:34<8:48:08, 14.90s/it] 36%|███▌      | 1183/3309 [5:06:48<8:45:13, 14.82s/it] 36%|███▌      | 1184/3309 [5:07:02<8:35:00, 14.54s/it] 36%|███▌      | 1185/3309 [5:07:19<8:57:40, 15.19s/it] 36%|███▌      | 1186/3309 [5:07:35<9:09:43, 15.54s/it] 36%|███▌      | 1187/3309 [5:07:51<9:17:11, 15.75s/it] 36%|███▌      | 1188/3309 [5:08:08<9:26:01, 16.01s/it] 36%|███▌      | 1189/3309 [5:08:22<9:03:49, 15.39s/it] 36%|███▌      | 1190/3309 [5:08:38<9:13:07, 15.66s/it]                                                       {'loss': 4.5498, 'grad_norm': 23.935726165771484, 'learning_rate': 7.4133139386190026e-06, 'epoch': 0.36}
+ 36%|███▌      | 1190/3309 [5:08:38<9:13:07, 15.66s/it] 36%|███▌      | 1191/3309 [5:08:55<9:20:31, 15.88s/it] 36%|███▌      | 1192/3309 [5:09:11<9:26:58, 16.07s/it] 36%|███▌      | 1193/3309 [5:09:25<9:06:35, 15.50s/it] 36%|███▌      | 1194/3309 [5:09:40<8:55:38, 15.20s/it] 36%|███▌      | 1195/3309 [5:09:54<8:49:26, 15.03s/it] 36%|███▌      | 1196/3309 [5:10:09<8:40:26, 14.78s/it] 36%|███▌      | 1197/3309 [5:10:25<8:55:36, 15.22s/it] 36%|███▌      | 1198/3309 [5:10:41<9:06:29, 15.53s/it] 36%|███▌      | 1199/3309 [5:10:56<8:56:56, 15.27s/it] 36%|███▋      | 1200/3309 [5:11:10<8:46:24, 14.98s/it]                                                       {'loss': 5.2042, 'grad_norm': 18.697385787963867, 'learning_rate': 7.3703285078836796e-06, 'epoch': 0.36}
+ 36%|███▋      | 1200/3309 [5:11:10<8:46:24, 14.98s/it] 36%|███▋      | 1201/3309 [5:11:25<8:41:13, 14.84s/it] 36%|███▋      | 1202/3309 [5:11:41<9:00:20, 15.39s/it] 36%|███▋      | 1203/3309 [5:11:58<9:11:13, 15.70s/it] 36%|███▋      | 1204/3309 [5:12:14<9:18:25, 15.92s/it] 36%|███▋      | 1205/3309 [5:12:31<9:22:50, 16.05s/it] 36%|███▋      | 1206/3309 [5:12:47<9:24:43, 16.11s/it] 36%|███▋      | 1207/3309 [5:13:03<9:30:07, 16.27s/it] 37%|███▋      | 1208/3309 [5:13:20<9:33:48, 16.39s/it] 37%|███▋      | 1209/3309 [5:13:35<9:14:28, 15.84s/it] 37%|███▋      | 1210/3309 [5:13:49<8:57:16, 15.36s/it]                                                       {'loss': 3.7229, 'grad_norm': 17.5216064453125, 'learning_rate': 7.3271158996136625e-06, 'epoch': 0.37}
+ 37%|███▋      | 1210/3309 [5:13:49<8:57:16, 15.36s/it] 37%|███▋      | 1211/3309 [5:14:04<8:49:55, 15.16s/it] 37%|███▋      | 1212/3309 [5:14:18<8:42:24, 14.95s/it] 37%|███▋      | 1213/3309 [5:14:34<8:57:13, 15.38s/it] 37%|███▋      | 1214/3309 [5:14:51<9:06:41, 15.66s/it] 37%|███▋      | 1215/3309 [5:15:05<8:50:48, 15.21s/it] 37%|███▋      | 1216/3309 [5:15:21<9:03:07, 15.57s/it] 37%|███▋      | 1217/3309 [5:15:38<9:10:07, 15.78s/it] 37%|███▋      | 1218/3309 [5:15:52<8:53:30, 15.31s/it] 37%|███▋      | 1219/3309 [5:16:08<9:04:19, 15.63s/it] 37%|███▋      | 1220/3309 [5:16:24<9:11:29, 15.84s/it]                                                       {'loss': 4.403, 'grad_norm': 18.313034057617188, 'learning_rate': 7.283680255401049e-06, 'epoch': 0.37}
+ 37%|███▋      | 1220/3309 [5:16:24<9:11:29, 15.84s/it] 37%|███▋      | 1221/3309 [5:16:41<9:15:32, 15.96s/it] 37%|███▋      | 1222/3309 [5:16:55<8:54:32, 15.37s/it] 37%|███▋      | 1223/3309 [5:17:09<8:47:20, 15.17s/it] 37%|███▋      | 1224/3309 [5:17:24<8:41:39, 15.01s/it] 37%|███▋      | 1225/3309 [5:17:38<8:32:52, 14.77s/it] 37%|███▋      | 1226/3309 [5:17:55<8:49:03, 15.24s/it] 37%|███▋      | 1227/3309 [5:18:09<8:38:07, 14.93s/it] 37%|███▋      | 1228/3309 [5:18:23<8:32:01, 14.76s/it] 37%|███▋      | 1229/3309 [5:18:40<8:50:24, 15.30s/it] 37%|███▋      | 1230/3309 [5:18:56<9:00:18, 15.59s/it]                                                       {'loss': 6.1978, 'grad_norm': 19.784748077392578, 'learning_rate': 7.240025738214193e-06, 'epoch': 0.37}
+ 37%|███▋      | 1230/3309 [5:18:56<9:00:18, 15.59s/it] 37%|███▋      | 1231/3309 [5:19:13<9:11:13, 15.92s/it] 37%|███▋      | 1232/3309 [5:19:29<9:18:33, 16.14s/it] 37%|███▋      | 1233/3309 [5:19:46<9:20:36, 16.20s/it] 37%|███▋      | 1234/3309 [5:20:00<9:01:32, 15.66s/it] 37%|███▋      | 1235/3309 [5:20:17<9:15:18, 16.06s/it] 37%|███▋      | 1236/3309 [5:20:33<9:18:09, 16.16s/it] 37%|███▋      | 1237/3309 [5:20:50<9:19:27, 16.20s/it] 37%|███▋      | 1238/3309 [5:21:06<9:20:37, 16.24s/it] 37%|███▋      | 1239/3309 [5:21:22<9:21:11, 16.27s/it] 37%|███▋      | 1240/3309 [5:21:37<9:04:28, 15.79s/it]                                                       {'loss': 4.4892, 'grad_norm': 33.28024673461914, 'learning_rate': 7.196156531998718e-06, 'epoch': 0.37}
+ 37%|███▋      | 1240/3309 [5:21:37<9:04:28, 15.79s/it] 38%|███▊      | 1241/3309 [5:21:54<9:13:12, 16.05s/it] 38%|███▊      | 1242/3309 [5:22:10<9:15:32, 16.13s/it] 38%|███▊      | 1243/3309 [5:22:26<9:17:23, 16.19s/it] 38%|███▊      | 1244/3309 [5:22:43<9:19:17, 16.25s/it] 38%|███▊      | 1245/3309 [5:23:02<9:45:20, 17.02s/it] 38%|███▊      | 1246/3309 [5:23:16<9:19:59, 16.29s/it] 38%|███▊      | 1247/3309 [5:23:33<9:26:56, 16.50s/it] 38%|███▊      | 1248/3309 [5:23:50<9:27:43, 16.53s/it] 38%|███▊      | 1249/3309 [5:24:07<9:37:16, 16.81s/it] 38%|███▊      | 1250/3309 [5:24:24<9:32:13, 16.67s/it]                                                       {'loss': 3.6566, 'grad_norm': 20.449913024902344, 'learning_rate': 7.152076841276527e-06, 'epoch': 0.38}
+ 38%|███▊      | 1250/3309 [5:24:24<9:32:13, 16.67s/it] 38%|███▊      | 1251/3309 [5:24:40<9:28:15, 16.57s/it] 38%|███▊      | 1252/3309 [5:24:56<9:25:34, 16.50s/it] 38%|███▊      | 1253/3309 [5:25:13<9:29:41, 16.63s/it] 38%|███▊      | 1254/3309 [5:25:28<9:07:56, 16.00s/it] 38%|███▊      | 1255/3309 [5:25:42<8:49:26, 15.47s/it] 38%|███▊      | 1256/3309 [5:25:56<8:39:19, 15.18s/it] 38%|███▊      | 1257/3309 [5:26:12<8:40:02, 15.21s/it] 38%|███▊      | 1258/3309 [5:26:26<8:29:17, 14.90s/it] 38%|███▊      | 1259/3309 [5:26:40<8:22:07, 14.70s/it] 38%|███▊      | 1260/3309 [5:26:54<8:16:47, 14.55s/it]                                                       {'loss': 3.7812, 'grad_norm': 19.441957473754883, 'learning_rate': 7.1077908907428154e-06, 'epoch': 0.38}
+ 38%|███▊      | 1260/3309 [5:26:54<8:16:47, 14.55s/it] 38%|███▊      | 1261/3309 [5:27:11<8:34:05, 15.06s/it] 38%|███▊      | 1262/3309 [5:27:27<8:49:26, 15.52s/it] 38%|███▊      | 1263/3309 [5:27:41<8:35:31, 15.12s/it] 38%|███▊      | 1264/3309 [5:27:58<8:51:00, 15.58s/it] 38%|███▊      | 1265/3309 [5:28:15<9:01:31, 15.90s/it] 38%|███▊      | 1266/3309 [5:28:30<8:50:58, 15.59s/it] 38%|███▊      | 1267/3309 [5:28:43<8:33:47, 15.10s/it] 38%|███▊      | 1268/3309 [5:28:57<8:22:14, 14.76s/it] 38%|███▊      | 1269/3309 [5:29:14<8:37:35, 15.22s/it] 38%|███▊      | 1270/3309 [5:29:28<8:30:55, 15.03s/it]                                                       {'loss': 3.8969, 'grad_norm': 32.515724182128906, 'learning_rate': 7.063302924861182e-06, 'epoch': 0.38}
+ 38%|███▊      | 1270/3309 [5:29:28<8:30:55, 15.03s/it] 38%|███▊      | 1271/3309 [5:29:45<8:44:40, 15.45s/it] 38%|███▊      | 1272/3309 [5:29:59<8:34:35, 15.16s/it] 38%|███▊      | 1273/3309 [5:30:13<8:24:33, 14.87s/it] 39%|███▊      | 1274/3309 [5:30:28<8:17:27, 14.67s/it] 39%|███▊      | 1275/3309 [5:30:42<8:12:56, 14.54s/it] 39%|███▊      | 1276/3309 [5:30:56<8:09:23, 14.44s/it] 39%|███▊      | 1277/3309 [5:31:12<8:28:33, 15.02s/it] 39%|███▊      | 1278/3309 [5:31:29<8:41:26, 15.40s/it] 39%|███▊      | 1279/3309 [5:31:45<8:50:21, 15.68s/it] 39%|███▊      | 1280/3309 [5:32:02<9:00:05, 15.97s/it]                                                       {'loss': 3.5997, 'grad_norm': 22.129140853881836, 'learning_rate': 7.018617207456821e-06, 'epoch': 0.39}
+ 39%|███▊      | 1280/3309 [5:32:02<9:00:05, 15.97s/it] 39%|███▊      | 1281/3309 [5:32:18<9:06:15, 16.16s/it] 39%|███▊      | 1282/3309 [5:32:35<9:14:13, 16.41s/it] 39%|███▉      | 1283/3309 [5:32:50<8:55:41, 15.86s/it] 39%|███▉      | 1284/3309 [5:33:04<8:38:35, 15.37s/it] 39%|███▉      | 1285/3309 [5:33:21<8:48:52, 15.68s/it] 39%|███▉      | 1286/3309 [5:33:37<8:55:58, 15.90s/it] 39%|███▉      | 1287/3309 [5:33:54<9:03:29, 16.13s/it] 39%|███▉      | 1288/3309 [5:34:08<8:43:39, 15.55s/it] 39%|███▉      | 1289/3309 [5:34:24<8:54:07, 15.87s/it] 39%|███▉      | 1290/3309 [5:34:41<9:01:20, 16.09s/it]                                                       {'loss': 3.6646, 'grad_norm': 19.576011657714844, 'learning_rate': 6.973738021307872e-06, 'epoch': 0.39}
+ 39%|███▉      | 1290/3309 [5:34:41<9:01:20, 16.09s/it] 39%|███▉      | 1291/3309 [5:34:55<8:39:42, 15.45s/it] 39%|███▉      | 1292/3309 [5:35:10<8:31:47, 15.22s/it] 39%|███▉      | 1293/3309 [5:35:26<8:42:32, 15.55s/it] 39%|███▉      | 1294/3309 [5:35:40<8:30:35, 15.20s/it] 39%|███▉      | 1295/3309 [5:35:57<8:41:44, 15.54s/it] 39%|███▉      | 1296/3309 [5:36:11<8:28:07, 15.15s/it] 39%|███▉      | 1297/3309 [5:36:28<8:43:04, 15.60s/it] 39%|███▉      | 1298/3309 [5:36:45<8:57:03, 16.02s/it] 39%|███▉      | 1299/3309 [5:36:59<8:43:19, 15.62s/it] 39%|███▉      | 1300/3309 [5:37:16<8:53:07, 15.92s/it]                                                       {'loss': 5.9623, 'grad_norm': 17.848796844482422, 'learning_rate': 6.9286696677349455e-06, 'epoch': 0.39}
+ 39%|███▉      | 1300/3309 [5:37:16<8:53:07, 15.92s/it] 39%|███▉      | 1301/3309 [5:37:32<8:55:20, 16.00s/it] 39%|███▉      | 1302/3309 [5:37:46<8:37:07, 15.46s/it] 39%|███▉      | 1303/3309 [5:38:00<8:23:16, 15.05s/it] 39%|███▉      | 1304/3309 [5:38:17<8:35:27, 15.43s/it] 39%|███▉      | 1305/3309 [5:38:33<8:44:57, 15.72s/it] 39%|███▉      | 1306/3309 [5:38:47<8:29:27, 15.26s/it] 39%|███▉      | 1307/3309 [5:39:04<8:43:32, 15.69s/it] 40%|███▉      | 1308/3309 [5:39:21<8:52:44, 15.97s/it] 40%|███▉      | 1309/3309 [5:39:37<8:56:33, 16.10s/it] 40%|███▉      | 1310/3309 [5:39:53<8:58:54, 16.18s/it]                                                       {'loss': 3.6821, 'grad_norm': 15.815289497375488, 'learning_rate': 6.883416466188881e-06, 'epoch': 0.4}
+ 40%|███▉      | 1310/3309 [5:39:53<8:58:54, 16.18s/it] 40%|███▉      | 1311/3309 [5:40:08<8:38:48, 15.58s/it] 40%|███▉      | 1312/3309 [5:40:22<8:25:20, 15.18s/it] 40%|███▉      | 1313/3309 [5:40:38<8:39:38, 15.62s/it] 40%|███▉      | 1314/3309 [5:40:55<8:49:40, 15.93s/it] 40%|███▉      | 1315/3309 [5:41:12<8:56:54, 16.16s/it] 40%|███▉      | 1316/3309 [5:41:28<8:57:56, 16.19s/it] 40%|███▉      | 1317/3309 [5:41:44<8:59:57, 16.26s/it] 40%|███▉      | 1318/3309 [5:42:01<9:03:45, 16.39s/it] 40%|███▉      | 1319/3309 [5:42:18<9:08:42, 16.54s/it] 40%|███▉      | 1320/3309 [5:42:34<9:06:41, 16.49s/it]                                                       {'loss': 2.8778, 'grad_norm': 17.62392807006836, 'learning_rate': 6.837982753836755e-06, 'epoch': 0.4}
+ 40%|███▉      | 1320/3309 [5:42:34<9:06:41, 16.49s/it] 40%|███▉      | 1321/3309 [5:42:51<9:04:31, 16.43s/it] 40%|███▉      | 1322/3309 [5:43:05<8:41:27, 15.75s/it] 40%|███▉      | 1323/3309 [5:43:21<8:47:23, 15.93s/it] 40%|████      | 1324/3309 [5:43:36<8:34:09, 15.54s/it] 40%|████      | 1325/3309 [5:43:52<8:41:35, 15.77s/it] 40%|████      | 1326/3309 [5:44:09<8:48:03, 15.98s/it] 40%|████      | 1327/3309 [5:44:23<8:30:20, 15.45s/it] 40%|████      | 1328/3309 [5:44:38<8:22:34, 15.22s/it] 40%|████      | 1329/3309 [5:44:52<8:16:28, 15.04s/it] 40%|████      | 1330/3309 [5:45:07<8:12:29, 14.93s/it]                                                       {'loss': 6.0046, 'grad_norm': 34.39213180541992, 'learning_rate': 6.7923728851461955e-06, 'epoch': 0.4}
+ 40%|████      | 1330/3309 [5:45:07<8:12:29, 14.93s/it] 40%|████      | 1331/3309 [5:45:23<8:25:44, 15.34s/it] 40%|████      | 1332/3309 [5:45:39<8:35:14, 15.64s/it] 40%|████      | 1333/3309 [5:45:54<8:24:25, 15.32s/it] 40%|████      | 1334/3309 [5:46:10<8:34:10, 15.62s/it] 40%|████      | 1335/3309 [5:46:27<8:44:34, 15.94s/it] 40%|████      | 1336/3309 [5:46:41<8:27:05, 15.42s/it] 40%|████      | 1337/3309 [5:46:58<8:38:22, 15.77s/it] 40%|████      | 1338/3309 [5:47:12<8:23:15, 15.32s/it] 40%|████      | 1339/3309 [5:47:28<8:32:00, 15.59s/it] 40%|████      | 1340/3309 [5:47:45<8:38:05, 15.79s/it]                                                       {'loss': 3.6498, 'grad_norm': 22.834793090820312, 'learning_rate': 6.74659123146805e-06, 'epoch': 0.4}
+ 40%|████      | 1340/3309 [5:47:45<8:38:05, 15.79s/it] 41%|████      | 1341/3309 [5:48:01<8:46:15, 16.04s/it] 41%|████      | 1342/3309 [5:48:18<8:48:56, 16.13s/it] 41%|████      | 1343/3309 [5:48:34<8:50:20, 16.19s/it] 41%|████      | 1344/3309 [5:48:50<8:52:19, 16.25s/it] 41%|████      | 1345/3309 [5:49:07<8:52:33, 16.27s/it] 41%|████      | 1346/3309 [5:49:23<8:53:17, 16.30s/it] 41%|████      | 1347/3309 [5:49:39<8:52:13, 16.28s/it] 41%|████      | 1348/3309 [5:49:55<8:49:34, 16.20s/it] 41%|████      | 1349/3309 [5:50:12<8:50:07, 16.23s/it] 41%|████      | 1350/3309 [5:50:26<8:30:27, 15.63s/it]                                                       {'loss': 2.8181, 'grad_norm': 18.146869659423828, 'learning_rate': 6.70064218061742e-06, 'epoch': 0.41}
+ 41%|████      | 1350/3309 [5:50:26<8:30:27, 15.63s/it] 41%|████      | 1351/3309 [5:50:40<8:15:40, 15.19s/it] 41%|████      | 1352/3309 [5:50:54<8:03:27, 14.82s/it] 41%|████      | 1353/3309 [5:51:09<8:04:12, 14.85s/it] 41%|████      | 1354/3309 [5:51:25<8:19:08, 15.32s/it] 41%|████      | 1355/3309 [5:51:40<8:10:43, 15.07s/it] 41%|████      | 1356/3309 [5:51:56<8:22:36, 15.44s/it] 41%|████      | 1357/3309 [5:52:10<8:07:27, 14.98s/it] 41%|████      | 1358/3309 [5:52:25<8:03:48, 14.88s/it] 41%|████      | 1359/3309 [5:52:39<7:59:40, 14.76s/it] 41%|████      | 1360/3309 [5:52:53<7:53:55, 14.59s/it]                                                       {'loss': 4.3635, 'grad_norm': 18.262357711791992, 'learning_rate': 6.654530136453119e-06, 'epoch': 0.41}
+ 41%|████      | 1360/3309 [5:52:53<7:53:55, 14.59s/it] 41%|████      | 1361/3309 [5:53:10<8:13:44, 15.21s/it] 41%|████      | 1362/3309 [5:53:24<8:06:03, 14.98s/it] 41%|████      | 1363/3309 [5:53:39<8:02:17, 14.87s/it] 41%|████      | 1364/3309 [5:53:55<8:13:50, 15.23s/it] 41%|████▏     | 1365/3309 [5:54:09<8:03:35, 14.93s/it] 41%|████▏     | 1366/3309 [5:54:23<7:56:30, 14.71s/it] 41%|████▏     | 1367/3309 [5:54:38<7:51:51, 14.58s/it] 41%|████▏     | 1368/3309 [5:54:52<7:51:26, 14.57s/it] 41%|████▏     | 1369/3309 [5:55:06<7:47:22, 14.45s/it] 41%|████▏     | 1370/3309 [5:55:23<8:04:06, 14.98s/it]                                                       {'loss': 5.2127, 'grad_norm': 18.1636905670166, 'learning_rate': 6.608259518455599e-06, 'epoch': 0.41}
+ 41%|████▏     | 1370/3309 [5:55:23<8:04:06, 14.98s/it] 41%|████▏     | 1371/3309 [5:55:39<8:19:21, 15.46s/it] 41%|████▏     | 1372/3309 [5:55:56<8:28:11, 15.74s/it] 41%|████▏     | 1373/3309 [5:56:10<8:16:49, 15.40s/it] 42%|████▏     | 1374/3309 [5:56:24<8:02:21, 14.96s/it] 42%|████▏     | 1375/3309 [5:56:39<7:58:52, 14.86s/it] 42%|████▏     | 1376/3309 [5:56:53<7:56:41, 14.80s/it] 42%|████▏     | 1377/3309 [5:57:10<8:10:10, 15.22s/it] 42%|████▏     | 1378/3309 [5:57:26<8:19:10, 15.51s/it] 42%|████▏     | 1379/3309 [5:57:40<8:09:13, 15.21s/it] 42%|████▏     | 1380/3309 [5:57:57<8:20:28, 15.57s/it]                                                       {'loss': 5.1173, 'grad_norm': 17.246234893798828, 'learning_rate': 6.5618347613033875e-06, 'epoch': 0.42}
+ 42%|████▏     | 1380/3309 [5:57:57<8:20:28, 15.57s/it] 42%|████▏     | 1381/3309 [5:58:13<8:27:13, 15.79s/it] 42%|████▏     | 1382/3309 [5:58:28<8:15:54, 15.44s/it] 42%|████▏     | 1383/3309 [5:58:44<8:23:56, 15.70s/it] 42%|████▏     | 1384/3309 [5:58:58<8:11:46, 15.33s/it] 42%|████▏     | 1385/3309 [5:59:13<8:02:01, 15.03s/it] 42%|████▏     | 1386/3309 [5:59:27<7:53:41, 14.78s/it] 42%|████▏     | 1387/3309 [5:59:44<8:10:39, 15.32s/it] 42%|████▏     | 1388/3309 [5:59:58<7:59:50, 14.99s/it] 42%|████▏     | 1389/3309 [6:00:12<7:49:54, 14.68s/it] 42%|████▏     | 1390/3309 [6:00:28<8:04:37, 15.15s/it]                                                       {'loss': 5.9817, 'grad_norm': 19.54306983947754, 'learning_rate': 6.5152603144480406e-06, 'epoch': 0.42}
+ 42%|████▏     | 1390/3309 [6:00:28<8:04:37, 15.15s/it] 42%|████▏     | 1391/3309 [6:00:42<7:55:36, 14.88s/it] 42%|████▏     | 1392/3309 [6:00:56<7:48:56, 14.68s/it] 42%|████▏     | 1393/3309 [6:01:11<7:44:09, 14.54s/it] 42%|████▏     | 1394/3309 [6:01:27<8:03:05, 15.14s/it] 42%|████▏     | 1395/3309 [6:01:41<7:54:12, 14.87s/it] 42%|████▏     | 1396/3309 [6:01:58<8:10:00, 15.37s/it] 42%|████▏     | 1397/3309 [6:02:12<7:59:14, 15.04s/it] 42%|████▏     | 1398/3309 [6:02:29<8:11:40, 15.44s/it] 42%|████▏     | 1399/3309 [6:02:43<8:02:21, 15.15s/it] 42%|████▏     | 1400/3309 [6:02:58<7:57:33, 15.01s/it]                                                       {'loss': 4.5568, 'grad_norm': 31.445457458496094, 'learning_rate': 6.468540641687716e-06, 'epoch': 0.42}
+ 42%|████▏     | 1400/3309 [6:02:58<7:57:33, 15.01s/it] 42%|████▏     | 1401/3309 [6:03:14<8:09:40, 15.40s/it] 42%|████▏     | 1402/3309 [6:03:29<8:00:24, 15.11s/it] 42%|████▏     | 1403/3309 [6:03:42<7:49:20, 14.77s/it] 42%|████▏     | 1404/3309 [6:03:59<8:04:09, 15.25s/it] 42%|████▏     | 1405/3309 [6:04:13<7:54:07, 14.94s/it] 42%|████▏     | 1406/3309 [6:04:27<7:46:53, 14.72s/it] 43%|████▎     | 1407/3309 [6:04:44<8:05:20, 15.31s/it] 43%|████▎     | 1408/3309 [6:05:00<8:14:58, 15.62s/it] 43%|████▎     | 1409/3309 [6:05:17<8:21:40, 15.84s/it] 43%|████▎     | 1410/3309 [6:05:31<8:06:19, 15.37s/it]                                                       {'loss': 3.9311, 'grad_norm': 19.258493423461914, 'learning_rate': 6.421680220739337e-06, 'epoch': 0.43}
+ 43%|████▎     | 1410/3309 [6:05:31<8:06:19, 15.37s/it] 43%|████▎     | 1411/3309 [6:05:45<7:58:19, 15.12s/it] 43%|████▎     | 1412/3309 [6:06:02<8:10:16, 15.51s/it] 43%|████▎     | 1413/3309 [6:06:16<7:57:57, 15.13s/it] 43%|████▎     | 1414/3309 [6:06:31<7:54:03, 15.01s/it] 43%|████▎     | 1415/3309 [6:06:45<7:48:26, 14.84s/it] 43%|████▎     | 1416/3309 [6:07:02<8:05:51, 15.40s/it] 43%|████▎     | 1417/3309 [6:07:17<7:57:19, 15.14s/it] 43%|████▎     | 1418/3309 [6:07:31<7:47:24, 14.83s/it] 43%|████▎     | 1419/3309 [6:07:45<7:41:37, 14.65s/it] 43%|████▎     | 1420/3309 [6:07:59<7:40:55, 14.64s/it]                                                       {'loss': 7.8417, 'grad_norm': 33.21185302734375, 'learning_rate': 6.374683542809447e-06, 'epoch': 0.43}
+ 43%|████▎     | 1420/3309 [6:07:59<7:40:55, 14.64s/it] 43%|████▎     | 1421/3309 [6:08:14<7:40:45, 14.64s/it] 43%|████▎     | 1422/3309 [6:08:29<7:39:06, 14.60s/it] 43%|████▎     | 1423/3309 [6:08:45<7:57:48, 15.20s/it] 43%|████▎     | 1424/3309 [6:09:02<8:11:27, 15.64s/it] 43%|████▎     | 1425/3309 [6:09:18<8:18:04, 15.86s/it] 43%|████▎     | 1426/3309 [6:09:35<8:25:33, 16.11s/it] 43%|████▎     | 1427/3309 [6:09:49<8:07:42, 15.55s/it] 43%|████▎     | 1428/3309 [6:10:06<8:17:38, 15.87s/it] 43%|████▎     | 1429/3309 [6:10:22<8:22:19, 16.03s/it] 43%|████▎     | 1430/3309 [6:10:39<8:28:30, 16.24s/it]                                                       {'loss': 4.3582, 'grad_norm': 19.956239700317383, 'learning_rate': 6.327555112163761e-06, 'epoch': 0.43}
+ 43%|████▎     | 1430/3309 [6:10:39<8:28:30, 16.24s/it] 43%|████▎     | 1431/3309 [6:10:54<8:12:38, 15.74s/it] 43%|████▎     | 1432/3309 [6:11:10<8:17:38, 15.91s/it] 43%|████▎     | 1433/3309 [6:11:26<8:23:30, 16.10s/it] 43%|████▎     | 1434/3309 [6:11:43<8:28:05, 16.26s/it] 43%|████▎     | 1435/3309 [6:11:58<8:12:24, 15.77s/it] 43%|████▎     | 1436/3309 [6:12:12<8:01:05, 15.41s/it] 43%|████▎     | 1437/3309 [6:12:29<8:10:00, 15.71s/it] 43%|████▎     | 1438/3309 [6:12:45<8:15:46, 15.90s/it] 43%|████▎     | 1439/3309 [6:13:02<8:22:33, 16.12s/it] 44%|████▎     | 1440/3309 [6:13:18<8:27:38, 16.30s/it]                                                       {'loss': 5.2, 'grad_norm': 19.256486892700195, 'learning_rate': 6.280299445695469e-06, 'epoch': 0.44}
+ 44%|████▎     | 1440/3309 [6:13:18<8:27:38, 16.30s/it] 44%|████▎     | 1441/3309 [6:13:33<8:08:21, 15.69s/it] 44%|████▎     | 1442/3309 [6:13:47<7:54:02, 15.23s/it] 44%|████▎     | 1443/3309 [6:14:01<7:47:01, 15.02s/it] 44%|████▎     | 1444/3309 [6:14:16<7:42:45, 14.89s/it] 44%|████▎     | 1445/3309 [6:14:30<7:33:39, 14.60s/it] 44%|████▎     | 1446/3309 [6:14:46<7:48:52, 15.10s/it] 44%|████▎     | 1447/3309 [6:15:00<7:41:00, 14.86s/it] 44%|████▍     | 1448/3309 [6:15:15<7:35:06, 14.67s/it] 44%|████▍     | 1449/3309 [6:15:29<7:34:08, 14.65s/it] 44%|████▍     | 1450/3309 [6:15:43<7:26:40, 14.42s/it]                                                       {'loss': 4.3409, 'grad_norm': 20.045286178588867, 'learning_rate': 6.232921072492319e-06, 'epoch': 0.44}
+ 44%|████▍     | 1450/3309 [6:15:43<7:26:40, 14.42s/it] 44%|████▍     | 1451/3309 [6:15:57<7:24:13, 14.35s/it] 44%|████▍     | 1452/3309 [6:16:13<7:41:29, 14.91s/it] 44%|████▍     | 1453/3309 [6:16:30<7:53:40, 15.31s/it] 44%|████▍     | 1454/3309 [6:16:44<7:45:02, 15.04s/it] 44%|████▍     | 1455/3309 [6:17:00<7:56:48, 15.43s/it] 44%|████▍     | 1456/3309 [6:17:17<8:04:27, 15.69s/it] 44%|████▍     | 1457/3309 [6:17:31<7:55:17, 15.40s/it] 44%|████▍     | 1458/3309 [6:17:48<8:06:07, 15.76s/it] 44%|████▍     | 1459/3309 [6:18:04<8:10:17, 15.90s/it] 44%|████▍     | 1460/3309 [6:18:19<7:54:29, 15.40s/it]                                                       {'loss': 4.3162, 'grad_norm': 24.16641616821289, 'learning_rate': 6.185424533402543e-06, 'epoch': 0.44}
+ 44%|████▍     | 1460/3309 [6:18:19<7:54:29, 15.40s/it] 44%|████▍     | 1461/3309 [6:18:33<7:46:50, 15.16s/it] 44%|████▍     | 1462/3309 [6:18:47<7:37:39, 14.87s/it] 44%|████▍     | 1463/3309 [6:19:04<7:50:29, 15.29s/it] 44%|████▍     | 1464/3309 [6:19:20<7:59:29, 15.59s/it] 44%|████▍     | 1465/3309 [6:19:36<8:05:49, 15.81s/it] 44%|████▍     | 1466/3309 [6:19:50<7:50:38, 15.32s/it] 44%|████▍     | 1467/3309 [6:20:07<7:59:41, 15.63s/it] 44%|████▍     | 1468/3309 [6:20:23<8:05:37, 15.83s/it] 44%|████▍     | 1469/3309 [6:20:39<8:09:00, 15.95s/it] 44%|████▍     | 1470/3309 [6:20:56<8:12:02, 16.05s/it]                                                       {'loss': 3.5112, 'grad_norm': 23.316164016723633, 'learning_rate': 6.13781438059966e-06, 'epoch': 0.44}
+ 44%|████▍     | 1470/3309 [6:20:56<8:12:02, 16.05s/it] 44%|████▍     | 1471/3309 [6:21:12<8:13:15, 16.10s/it] 44%|████▍     | 1472/3309 [6:21:28<8:18:03, 16.27s/it] 45%|████▍     | 1473/3309 [6:21:43<8:00:58, 15.72s/it] 45%|████▍     | 1474/3309 [6:21:57<7:47:32, 15.29s/it] 45%|████▍     | 1475/3309 [6:22:11<7:34:36, 14.87s/it] 45%|████▍     | 1476/3309 [6:22:25<7:27:22, 14.64s/it] 45%|████▍     | 1477/3309 [6:22:39<7:23:09, 14.51s/it] 45%|████▍     | 1478/3309 [6:22:58<8:01:05, 15.77s/it] 45%|████▍     | 1479/3309 [6:23:13<7:50:53, 15.44s/it] 45%|████▍     | 1480/3309 [6:23:27<7:43:20, 15.20s/it]                                                       {'loss': 5.1696, 'grad_norm': 34.204627990722656, 'learning_rate': 6.090095177146178e-06, 'epoch': 0.45}
+ 45%|████▍     | 1480/3309 [6:23:27<7:43:20, 15.20s/it] 45%|████▍     | 1481/3309 [6:23:44<7:53:27, 15.54s/it] 45%|████▍     | 1482/3309 [6:24:00<8:00:02, 15.77s/it] 45%|████▍     | 1483/3309 [6:24:16<8:04:40, 15.93s/it] 45%|████▍     | 1484/3309 [6:24:33<8:11:14, 16.15s/it] 45%|████▍     | 1485/3309 [6:24:47<7:53:55, 15.59s/it] 45%|████▍     | 1486/3309 [6:25:03<7:59:28, 15.78s/it] 45%|████▍     | 1487/3309 [6:25:18<7:44:47, 15.31s/it] 45%|████▍     | 1488/3309 [6:25:32<7:34:28, 14.97s/it] 45%|████▍     | 1489/3309 [6:25:49<7:49:44, 15.49s/it] 45%|████▌     | 1490/3309 [6:26:03<7:36:10, 15.05s/it]                                                       {'loss': 2.7874, 'grad_norm': 17.53434181213379, 'learning_rate': 6.042271496556255e-06, 'epoch': 0.45}
+ 45%|████▌     | 1490/3309 [6:26:03<7:36:10, 15.05s/it] 45%|████▌     | 1491/3309 [6:26:19<7:47:40, 15.43s/it] 45%|████▌     | 1492/3309 [6:26:35<7:55:55, 15.72s/it] 45%|████▌     | 1493/3309 [6:26:52<8:02:56, 15.96s/it] 45%|████▌     | 1494/3309 [6:27:09<8:09:29, 16.18s/it] 45%|████▌     | 1495/3309 [6:27:25<8:13:43, 16.33s/it] 45%|████▌     | 1496/3309 [6:27:41<8:12:56, 16.31s/it] 45%|████▌     | 1497/3309 [6:27:56<7:57:38, 15.82s/it] 45%|████▌     | 1498/3309 [6:28:13<8:05:01, 16.07s/it] 45%|████▌     | 1499/3309 [6:28:27<7:48:22, 15.53s/it] 45%|████▌     | 1500/3309 [6:28:43<7:55:51, 15.78s/it]                                                       {'loss': 3.8133, 'grad_norm': 21.362934112548828, 'learning_rate': 5.994347922357372e-06, 'epoch': 0.45}
+ 45%|████▌     | 1500/3309 [6:28:43<7:55:51, 15.78s/it] 45%|████▌     | 1501/3309 [6:29:00<8:00:27, 15.94s/it] 45%|████▌     | 1502/3309 [6:29:16<8:03:58, 16.07s/it] 45%|████▌     | 1503/3309 [6:29:32<8:05:58, 16.15s/it] 45%|████▌     | 1504/3309 [6:29:49<8:07:51, 16.22s/it] 45%|████▌     | 1505/3309 [6:30:06<8:12:05, 16.37s/it] 46%|████▌     | 1506/3309 [6:30:20<7:55:17, 15.82s/it] 46%|████▌     | 1507/3309 [6:30:37<8:02:44, 16.07s/it] 46%|████▌     | 1508/3309 [6:30:51<7:46:08, 15.53s/it] 46%|████▌     | 1509/3309 [6:31:05<7:36:37, 15.22s/it] 46%|████▌     | 1510/3309 [6:31:22<7:47:00, 15.58s/it]                                                       {'loss': 3.592, 'grad_norm': 19.935638427734375, 'learning_rate': 5.946329047651037e-06, 'epoch': 0.46}
+ 46%|████▌     | 1510/3309 [6:31:22<7:47:00, 15.58s/it] 46%|████▌     | 1511/3309 [6:31:36<7:31:29, 15.07s/it] 46%|████▌     | 1512/3309 [6:31:52<7:43:03, 15.46s/it] 46%|████▌     | 1513/3309 [6:32:06<7:29:30, 15.02s/it] 46%|████▌     | 1514/3309 [6:32:22<7:39:37, 15.36s/it] 46%|████▌     | 1515/3309 [6:32:36<7:28:45, 15.01s/it] 46%|████▌     | 1516/3309 [6:32:53<7:40:19, 15.40s/it] 46%|████▌     | 1517/3309 [6:33:09<7:50:43, 15.76s/it] 46%|████▌     | 1518/3309 [6:33:26<7:54:48, 15.91s/it] 46%|████▌     | 1519/3309 [6:33:42<7:57:47, 16.02s/it] 46%|████▌     | 1520/3309 [6:33:56<7:42:00, 15.49s/it]                                                       {'loss': 2.7345, 'grad_norm': 17.95412826538086, 'learning_rate': 5.8982194746725686e-06, 'epoch': 0.46}
+ 46%|████▌     | 1520/3309 [6:33:56<7:42:00, 15.49s/it] 46%|████▌     | 1521/3309 [6:34:13<7:52:25, 15.85s/it] 46%|████▌     | 1522/3309 [6:34:29<7:56:40, 16.00s/it] 46%|████▌     | 1523/3309 [6:34:46<7:59:43, 16.12s/it] 46%|████▌     | 1524/3309 [6:35:04<8:23:27, 16.92s/it] 46%|████▌     | 1525/3309 [6:35:20<8:06:50, 16.37s/it] 46%|████▌     | 1526/3309 [6:35:34<7:49:33, 15.80s/it] 46%|████▌     | 1527/3309 [6:35:48<7:32:37, 15.24s/it] 46%|████▌     | 1528/3309 [6:36:02<7:25:12, 15.00s/it] 46%|████▌     | 1529/3309 [6:36:19<7:39:31, 15.49s/it] 46%|████▌     | 1530/3309 [6:36:35<7:47:02, 15.75s/it]                                                       {'loss': 4.2519, 'grad_norm': 24.026193618774414, 'learning_rate': 5.850023814350007e-06, 'epoch': 0.46}
+ 46%|████▌     | 1530/3309 [6:36:35<7:47:02, 15.75s/it] 46%|████▋     | 1531/3309 [6:36:49<7:30:48, 15.21s/it] 46%|████▋     | 1532/3309 [6:37:06<7:43:17, 15.64s/it] 46%|████▋     | 1533/3309 [6:37:22<7:49:22, 15.86s/it] 46%|████▋     | 1534/3309 [6:37:37<7:37:51, 15.48s/it] 46%|████▋     | 1535/3309 [6:37:51<7:26:32, 15.10s/it] 46%|████▋     | 1536/3309 [6:38:06<7:24:39, 15.05s/it] 46%|████▋     | 1537/3309 [6:38:22<7:34:03, 15.37s/it] 46%|████▋     | 1538/3309 [6:38:37<7:24:47, 15.07s/it] 47%|████▋     | 1539/3309 [6:38:51<7:18:11, 14.85s/it] 47%|████▋     | 1540/3309 [6:39:05<7:11:53, 14.65s/it]                                                       {'loss': 6.0717, 'grad_norm': 12.00658893585205, 'learning_rate': 5.801746685862197e-06, 'epoch': 0.47}
+ 47%|████▋     | 1540/3309 [6:39:05<7:11:53, 14.65s/it] 47%|████▋     | 1541/3309 [6:39:21<7:26:09, 15.14s/it] 47%|████▋     | 1542/3309 [6:39:38<7:36:45, 15.51s/it] 47%|████▋     | 1543/3309 [6:39:54<7:43:30, 15.75s/it] 47%|████▋     | 1544/3309 [6:40:10<7:47:45, 15.90s/it] 47%|████▋     | 1545/3309 [6:40:27<7:50:22, 16.00s/it] 47%|████▋     | 1546/3309 [6:40:44<7:59:46, 16.33s/it] 47%|████▋     | 1547/3309 [6:41:01<8:04:44, 16.51s/it] 47%|████▋     | 1548/3309 [6:41:15<7:46:35, 15.90s/it] 47%|████▋     | 1549/3309 [6:41:29<7:31:15, 15.38s/it] 47%|████▋     | 1550/3309 [6:41:45<7:35:57, 15.55s/it]                                                       {'loss': 2.8474, 'grad_norm': 14.519695281982422, 'learning_rate': 5.753392716196069e-06, 'epoch': 0.47}
+ 47%|████▋     | 1550/3309 [6:41:45<7:35:57, 15.55s/it] 47%|████▋     | 1551/3309 [6:42:01<7:42:31, 15.79s/it] 47%|████▋     | 1552/3309 [6:42:18<7:47:04, 15.95s/it] 47%|████▋     | 1553/3309 [6:42:34<7:50:05, 16.06s/it] 47%|████▋     | 1554/3309 [6:42:50<7:51:56, 16.13s/it] 47%|████▋     | 1555/3309 [6:43:07<7:53:33, 16.20s/it] 47%|████▋     | 1556/3309 [6:43:21<7:36:18, 15.62s/it] 47%|████▋     | 1557/3309 [6:43:36<7:27:14, 15.32s/it] 47%|████▋     | 1558/3309 [6:43:52<7:36:01, 15.63s/it] 47%|████▋     | 1559/3309 [6:44:06<7:20:40, 15.11s/it] 47%|████▋     | 1560/3309 [6:44:20<7:12:35, 14.84s/it]                                                       {'loss': 3.6301, 'grad_norm': 15.277630805969238, 'learning_rate': 5.704966539703185e-06, 'epoch': 0.47}
+ 47%|████▋     | 1560/3309 [6:44:20<7:12:35, 14.84s/it] 47%|████▋     | 1561/3309 [6:44:37<7:28:43, 15.40s/it] 47%|████▋     | 1562/3309 [6:44:51<7:18:09, 15.05s/it] 47%|████▋     | 1563/3309 [6:45:06<7:13:05, 14.88s/it] 47%|████▋     | 1564/3309 [6:45:22<7:25:03, 15.30s/it] 47%|████▋     | 1565/3309 [6:45:36<7:17:00, 15.03s/it] 47%|████▋     | 1566/3309 [6:45:53<7:30:40, 15.51s/it] 47%|████▋     | 1567/3309 [6:46:07<7:16:33, 15.04s/it] 47%|████▋     | 1568/3309 [6:46:23<7:27:28, 15.42s/it] 47%|████▋     | 1569/3309 [6:46:39<7:35:17, 15.70s/it] 47%|████▋     | 1570/3309 [6:46:56<7:40:19, 15.88s/it]                                                       {'loss': 4.4189, 'grad_norm': 17.934938430786133, 'learning_rate': 5.656472797655571e-06, 'epoch': 0.47}
+ 47%|████▋     | 1570/3309 [6:46:56<7:40:19, 15.88s/it] 47%|████▋     | 1571/3309 [6:47:10<7:25:44, 15.39s/it] 48%|████▊     | 1572/3309 [6:47:24<7:15:05, 15.03s/it] 48%|████▊     | 1573/3309 [6:47:38<7:07:31, 14.78s/it] 48%|████▊     | 1574/3309 [6:47:53<7:02:28, 14.61s/it] 48%|████▊     | 1575/3309 [6:48:09<7:16:13, 15.09s/it] 48%|████▊     | 1576/3309 [6:48:23<7:05:23, 14.73s/it] 48%|████▊     | 1577/3309 [6:48:39<7:22:14, 15.32s/it] 48%|████▊     | 1578/3309 [6:48:56<7:31:07, 15.64s/it] 48%|████▊     | 1579/3309 [6:49:10<7:18:57, 15.22s/it] 48%|████▊     | 1580/3309 [6:49:26<7:28:21, 15.56s/it]                                                       {'loss': 2.7758, 'grad_norm': 17.185529708862305, 'learning_rate': 5.60791613780088e-06, 'epoch': 0.48}
+ 48%|████▊     | 1580/3309 [6:49:26<7:28:21, 15.56s/it] 48%|████▊     | 1581/3309 [6:49:43<7:34:04, 15.77s/it] 48%|████▊     | 1582/3309 [6:49:59<7:42:05, 16.05s/it] 48%|████▊     | 1583/3309 [6:50:14<7:25:48, 15.50s/it] 48%|████▊     | 1584/3309 [6:50:30<7:35:28, 15.84s/it] 48%|████▊     | 1585/3309 [6:50:47<7:41:51, 16.07s/it] 48%|████▊     | 1586/3309 [6:51:01<7:25:15, 15.50s/it] 48%|████▊     | 1587/3309 [6:51:16<7:17:06, 15.23s/it] 48%|████▊     | 1588/3309 [6:51:32<7:26:07, 15.55s/it] 48%|████▊     | 1589/3309 [6:51:47<7:18:46, 15.31s/it] 48%|████▊     | 1590/3309 [6:52:03<7:29:56, 15.70s/it]                                                       {'loss': 4.296, 'grad_norm': 25.111557006835938, 'learning_rate': 5.5593012139169525e-06, 'epoch': 0.48}
+ 48%|████▊     | 1590/3309 [6:52:03<7:29:56, 15.70s/it] 48%|████▊     | 1591/3309 [6:52:20<7:37:31, 15.98s/it] 48%|████▊     | 1592/3309 [6:52:34<7:22:13, 15.45s/it] 48%|████▊     | 1593/3309 [6:52:49<7:15:02, 15.21s/it] 48%|████▊     | 1594/3309 [6:53:03<7:10:33, 15.06s/it] 48%|████▊     | 1595/3309 [6:53:20<7:21:58, 15.47s/it] 48%|████▊     | 1596/3309 [6:53:34<7:08:28, 15.01s/it] 48%|████▊     | 1597/3309 [6:53:50<7:19:26, 15.40s/it] 48%|████▊     | 1598/3309 [6:54:04<7:09:32, 15.06s/it] 48%|████▊     | 1599/3309 [6:54:21<7:19:25, 15.42s/it] 48%|████▊     | 1600/3309 [6:54:35<7:09:19, 15.07s/it]                                                       {'loss': 4.4462, 'grad_norm': 23.77570343017578, 'learning_rate': 5.510632685365777e-06, 'epoch': 0.48}
+ 48%|████▊     | 1600/3309 [6:54:35<7:09:19, 15.07s/it] 48%|████▊     | 1601/3309 [6:54:51<7:20:20, 15.47s/it] 48%|████▊     | 1602/3309 [6:55:06<7:09:34, 15.10s/it] 48%|████▊     | 1603/3309 [6:55:22<7:16:48, 15.36s/it] 48%|████▊     | 1604/3309 [6:55:36<7:07:05, 15.03s/it] 49%|████▊     | 1605/3309 [6:55:52<7:21:02, 15.53s/it] 49%|████▊     | 1606/3309 [6:56:09<7:26:51, 15.74s/it] 49%|████▊     | 1607/3309 [6:56:24<7:19:01, 15.48s/it] 49%|████▊     | 1608/3309 [6:56:40<7:26:16, 15.74s/it] 49%|████▊     | 1609/3309 [6:56:54<7:12:58, 15.28s/it] 49%|████▊     | 1610/3309 [6:57:08<7:03:02, 14.94s/it]                                                       {'loss': 2.7426, 'grad_norm': 17.37128448486328, 'learning_rate': 5.461915216646938e-06, 'epoch': 0.49}
+ 49%|████▊     | 1610/3309 [6:57:08<7:03:02, 14.94s/it] 49%|████▊     | 1611/3309 [6:57:25<7:14:53, 15.37s/it] 49%|████▊     | 1612/3309 [6:57:39<7:08:54, 15.16s/it] 49%|████▊     | 1613/3309 [6:57:54<7:03:16, 14.97s/it] 49%|████▉     | 1614/3309 [6:58:08<6:57:06, 14.76s/it] 49%|████▉     | 1615/3309 [6:58:25<7:14:19, 15.38s/it] 49%|████▉     | 1616/3309 [6:58:39<7:04:44, 15.05s/it] 49%|████▉     | 1617/3309 [6:58:56<7:14:55, 15.42s/it] 49%|████▉     | 1618/3309 [6:59:12<7:22:26, 15.70s/it] 49%|████▉     | 1619/3309 [6:59:26<7:09:23, 15.24s/it] 49%|████▉     | 1620/3309 [6:59:43<7:20:28, 15.65s/it]                                                       {'loss': 4.2378, 'grad_norm': 23.484580993652344, 'learning_rate': 5.41315347695055e-06, 'epoch': 0.49}
+ 49%|████▉     | 1620/3309 [6:59:43<7:20:28, 15.65s/it] 49%|████▉     | 1621/3309 [6:59:59<7:28:37, 15.95s/it] 49%|████▉     | 1622/3309 [7:00:16<7:31:04, 16.04s/it] 49%|████▉     | 1623/3309 [7:00:30<7:17:54, 15.58s/it] 49%|████▉     | 1624/3309 [7:00:45<7:08:21, 15.25s/it] 49%|████▉     | 1625/3309 [7:01:01<7:19:38, 15.66s/it] 49%|████▉     | 1626/3309 [7:01:16<7:10:54, 15.36s/it] 49%|████▉     | 1627/3309 [7:01:33<7:21:35, 15.75s/it] 49%|████▉     | 1628/3309 [7:01:49<7:25:55, 15.92s/it] 49%|████▉     | 1629/3309 [7:02:03<7:14:45, 15.53s/it] 49%|████▉     | 1630/3309 [7:02:18<7:03:58, 15.15s/it]                                                       {'loss': 4.8879, 'grad_norm': 23.495826721191406, 'learning_rate': 5.364352139709758e-06, 'epoch': 0.49}
+ 49%|████▉     | 1630/3309 [7:02:18<7:03:58, 15.15s/it] 49%|████▉     | 1631/3309 [7:02:34<7:12:58, 15.48s/it] 49%|████▉     | 1632/3309 [7:02:49<7:05:54, 15.24s/it] 49%|████▉     | 1633/3309 [7:03:03<6:57:42, 14.95s/it] 49%|████▉     | 1634/3309 [7:03:19<7:10:56, 15.44s/it] 49%|████▉     | 1635/3309 [7:03:36<7:20:48, 15.80s/it] 49%|████▉     | 1636/3309 [7:03:53<7:29:53, 16.14s/it] 49%|████▉     | 1637/3309 [7:04:09<7:31:03, 16.19s/it] 50%|████▉     | 1638/3309 [7:04:24<7:13:52, 15.58s/it] 50%|████▉     | 1639/3309 [7:04:38<7:08:13, 15.39s/it] 50%|████▉     | 1640/3309 [7:04:55<7:16:13, 15.68s/it]                                                       {'loss': 3.5359, 'grad_norm': 16.23356819152832, 'learning_rate': 5.315515882152822e-06, 'epoch': 0.5}
+ 50%|████▉     | 1640/3309 [7:04:55<7:16:13, 15.68s/it] 50%|████▉     | 1641/3309 [7:05:11<7:21:01, 15.86s/it] 50%|████▉     | 1642/3309 [7:05:28<7:25:08, 16.02s/it] 50%|████▉     | 1643/3309 [7:05:42<7:09:36, 15.47s/it] 50%|████▉     | 1644/3309 [7:05:58<7:16:36, 15.73s/it] 50%|████▉     | 1645/3309 [7:06:12<7:04:09, 15.29s/it] 50%|████▉     | 1646/3309 [7:06:27<6:57:24, 15.06s/it] 50%|████▉     | 1647/3309 [7:06:43<7:07:19, 15.43s/it] 50%|████▉     | 1648/3309 [7:07:02<7:34:22, 16.41s/it] 50%|████▉     | 1649/3309 [7:07:16<7:14:24, 15.70s/it] 50%|████▉     | 1650/3309 [7:07:32<7:19:30, 15.90s/it]                                                       {'loss': 4.2516, 'grad_norm': 16.77799415588379, 'learning_rate': 5.266649384854842e-06, 'epoch': 0.5}
+ 50%|████▉     | 1650/3309 [7:07:32<7:19:30, 15.90s/it] 50%|████▉     | 1651/3309 [7:07:49<7:22:52, 16.03s/it] 50%|████▉     | 1652/3309 [7:08:03<7:10:00, 15.57s/it] 50%|████▉     | 1653/3309 [7:08:17<6:58:44, 15.17s/it] 50%|████▉     | 1654/3309 [7:08:32<6:53:51, 15.00s/it] 50%|█████     | 1655/3309 [7:08:48<7:02:57, 15.34s/it] 50%|█████     | 1656/3309 [7:09:04<7:10:26, 15.62s/it] 50%|█████     | 1657/3309 [7:09:21<7:17:25, 15.89s/it] 50%|█████     | 1658/3309 [7:09:39<7:36:58, 16.61s/it] 50%|█████     | 1659/3309 [7:09:53<7:17:09, 15.90s/it] 50%|█████     | 1660/3309 [7:10:08<7:02:57, 15.39s/it]                                                       {'loss': 3.6844, 'grad_norm': 21.264799118041992, 'learning_rate': 5.217757331289165e-06, 'epoch': 0.5}
+ 50%|█████     | 1660/3309 [7:10:08<7:02:57, 15.39s/it] 50%|█████     | 1661/3309 [7:10:24<7:09:33, 15.64s/it] 50%|█████     | 1662/3309 [7:10:40<7:16:33, 15.90s/it] 50%|█████     | 1663/3309 [7:10:57<7:21:47, 16.10s/it] 50%|█████     | 1664/3309 [7:11:14<7:26:01, 16.27s/it] 50%|█████     | 1665/3309 [7:11:28<7:08:16, 15.63s/it] 50%|█████     | 1666/3309 [7:11:42<6:59:55, 15.33s/it] 50%|█████     | 1667/3309 [7:11:57<6:53:43, 15.12s/it] 50%|█████     | 1668/3309 [7:12:12<6:49:31, 14.97s/it] 50%|█████     | 1669/3309 [7:12:28<7:00:09, 15.37s/it] 50%|█████     | 1670/3309 [7:12:42<6:50:15, 15.02s/it]                                                       {'loss': 4.8485, 'grad_norm': 18.198184967041016, 'learning_rate': 5.168844407378506e-06, 'epoch': 0.5}
+ 50%|█████     | 1670/3309 [7:12:42<6:50:15, 15.02s/it] 50%|█████     | 1671/3309 [7:12:57<6:45:25, 14.85s/it] 51%|█████     | 1672/3309 [7:13:10<6:37:22, 14.56s/it] 51%|█████     | 1673/3309 [7:13:27<6:51:52, 15.11s/it] 51%|█████     | 1674/3309 [7:13:43<7:01:52, 15.48s/it] 51%|█████     | 1675/3309 [7:14:00<7:11:11, 15.83s/it] 51%|█████     | 1676/3309 [7:14:16<7:14:41, 15.97s/it] 51%|█████     | 1677/3309 [7:14:33<7:19:49, 16.17s/it] 51%|█████     | 1678/3309 [7:14:49<7:23:19, 16.31s/it] 51%|█████     | 1679/3309 [7:15:06<7:23:47, 16.34s/it] 51%|█████     | 1680/3309 [7:15:20<7:04:16, 15.63s/it]                                                       {'loss': 2.8835, 'grad_norm': 13.497072219848633, 'learning_rate': 5.119915301045836e-06, 'epoch': 0.51}
+ 51%|█████     | 1680/3309 [7:15:20<7:04:16, 15.63s/it] 51%|█████     | 1681/3309 [7:15:36<7:12:09, 15.93s/it] 51%|█████     | 1682/3309 [7:15:51<7:01:55, 15.56s/it] 51%|█████     | 1683/3309 [7:16:07<7:08:51, 15.82s/it] 51%|█████     | 1684/3309 [7:16:22<6:58:38, 15.46s/it] 51%|█████     | 1685/3309 [7:16:36<6:48:31, 15.09s/it] 51%|█████     | 1686/3309 [7:16:51<6:41:33, 14.84s/it] 51%|█████     | 1687/3309 [7:17:07<6:53:58, 15.31s/it] 51%|█████     | 1688/3309 [7:17:23<7:01:56, 15.62s/it] 51%|█████     | 1689/3309 [7:17:38<6:51:53, 15.26s/it] 51%|█████     | 1690/3309 [7:17:54<7:02:54, 15.67s/it]                                                       {'loss': 5.1527, 'grad_norm': 24.342716217041016, 'learning_rate': 5.070974701765089e-06, 'epoch': 0.51}
+ 51%|█████     | 1690/3309 [7:17:54<7:02:54, 15.67s/it] 51%|█████     | 1691/3309 [7:18:11<7:09:36, 15.93s/it] 51%|█████     | 1692/3309 [7:18:27<7:12:15, 16.04s/it] 51%|█████     | 1693/3309 [7:18:42<6:59:34, 15.58s/it] 51%|█████     | 1694/3309 [7:18:58<7:05:58, 15.83s/it] 51%|█████     | 1695/3309 [7:19:15<7:12:43, 16.09s/it] 51%|█████▏    | 1696/3309 [7:19:29<7:00:30, 15.64s/it] 51%|█████▏    | 1697/3309 [7:19:46<7:05:34, 15.84s/it] 51%|█████▏    | 1698/3309 [7:20:02<7:11:54, 16.09s/it] 51%|█████▏    | 1699/3309 [7:20:17<6:56:43, 15.53s/it] 51%|█████▏    | 1700/3309 [7:20:31<6:45:47, 15.13s/it]                                                       {'loss': 4.3981, 'grad_norm': 25.917234420776367, 'learning_rate': 5.022027300111712e-06, 'epoch': 0.51}
+ 51%|█████▏    | 1700/3309 [7:20:31<6:45:47, 15.13s/it] 51%|█████▏    | 1701/3309 [7:20:47<6:54:41, 15.47s/it] 51%|█████▏    | 1702/3309 [7:21:03<7:01:03, 15.72s/it] 51%|█████▏    | 1703/3309 [7:21:18<6:52:24, 15.41s/it] 51%|█████▏    | 1704/3309 [7:21:34<6:59:11, 15.67s/it] 52%|█████▏    | 1705/3309 [7:21:50<7:02:37, 15.81s/it] 52%|█████▏    | 1706/3309 [7:22:07<7:06:06, 15.95s/it] 52%|█████▏    | 1707/3309 [7:22:21<6:55:03, 15.55s/it] 52%|█████▏    | 1708/3309 [7:22:38<7:00:49, 15.77s/it] 52%|█████▏    | 1709/3309 [7:22:54<7:06:29, 15.99s/it] 52%|█████▏    | 1710/3309 [7:23:10<7:08:13, 16.07s/it]                                                       {'loss': 4.4554, 'grad_norm': 15.280237197875977, 'learning_rate': 4.973077787313099e-06, 'epoch': 0.52}
+ 52%|█████▏    | 1710/3309 [7:23:10<7:08:13, 16.07s/it] 52%|█████▏    | 1711/3309 [7:23:27<7:09:40, 16.13s/it] 52%|█████▏    | 1712/3309 [7:23:41<6:57:44, 15.69s/it] 52%|█████▏    | 1713/3309 [7:23:56<6:45:28, 15.24s/it] 52%|█████▏    | 1714/3309 [7:24:10<6:40:07, 15.05s/it] 52%|█████▏    | 1715/3309 [7:24:26<6:49:50, 15.43s/it] 52%|█████▏    | 1716/3309 [7:24:43<6:57:00, 15.71s/it] 52%|█████▏    | 1717/3309 [7:24:57<6:44:26, 15.24s/it] 52%|█████▏    | 1718/3309 [7:25:12<6:38:52, 15.04s/it] 52%|█████▏    | 1719/3309 [7:25:28<6:48:33, 15.42s/it] 52%|█████▏    | 1720/3309 [7:25:42<6:36:54, 14.99s/it]                                                       {'loss': 5.1108, 'grad_norm': 17.290264129638672, 'learning_rate': 4.924130854798983e-06, 'epoch': 0.52}
+ 52%|█████▏    | 1720/3309 [7:25:42<6:36:54, 14.99s/it] 52%|█████▏    | 1721/3309 [7:25:58<6:47:19, 15.39s/it] 52%|█████▏    | 1722/3309 [7:26:15<6:55:22, 15.70s/it] 52%|█████▏    | 1723/3309 [7:26:33<7:18:18, 16.58s/it] 52%|█████▏    | 1724/3309 [7:26:48<7:01:56, 15.97s/it] 52%|█████▏    | 1725/3309 [7:27:04<7:04:29, 16.08s/it] 52%|█████▏    | 1726/3309 [7:27:21<7:08:09, 16.23s/it] 52%|█████▏    | 1727/3309 [7:27:37<7:10:30, 16.33s/it] 52%|█████▏    | 1728/3309 [7:27:54<7:11:04, 16.36s/it] 52%|█████▏    | 1729/3309 [7:28:12<7:29:28, 17.07s/it] 52%|█████▏    | 1730/3309 [7:28:27<7:07:07, 16.23s/it]                                                       {'loss': 2.8006, 'grad_norm': 15.63051700592041, 'learning_rate': 4.875191193751803e-06, 'epoch': 0.52}
+ 52%|█████▏    | 1730/3309 [7:28:27<7:07:07, 16.23s/it] 52%|█████▏    | 1731/3309 [7:28:41<6:50:59, 15.63s/it] 52%|█████▏    | 1732/3309 [7:28:57<6:56:56, 15.86s/it] 52%|█████▏    | 1733/3309 [7:29:14<7:02:52, 16.10s/it] 52%|█████▏    | 1734/3309 [7:29:28<6:49:51, 15.61s/it] 52%|█████▏    | 1735/3309 [7:29:45<6:57:40, 15.92s/it] 52%|█████▏    | 1736/3309 [7:30:01<6:59:58, 16.02s/it] 52%|█████▏    | 1737/3309 [7:30:18<7:02:19, 16.12s/it] 53%|█████▎    | 1738/3309 [7:30:34<7:05:54, 16.27s/it] 53%|█████▎    | 1739/3309 [7:30:51<7:06:49, 16.31s/it] 53%|█████▎    | 1740/3309 [7:31:07<7:09:29, 16.42s/it]                                                       {'loss': 3.4979, 'grad_norm': 15.663633346557617, 'learning_rate': 4.826263494657077e-06, 'epoch': 0.53}
+ 53%|█████▎    | 1740/3309 [7:31:07<7:09:29, 16.42s/it] 53%|█████▎    | 1741/3309 [7:31:22<6:55:51, 15.91s/it] 53%|█████▎    | 1742/3309 [7:31:38<6:57:51, 16.00s/it] 53%|█████▎    | 1743/3309 [7:31:55<7:00:11, 16.10s/it] 53%|█████▎    | 1744/3309 [7:32:11<7:01:34, 16.16s/it] 53%|█████▎    | 1745/3309 [7:32:27<7:02:38, 16.21s/it] 53%|█████▎    | 1746/3309 [7:32:42<6:49:26, 15.72s/it] 53%|█████▎    | 1747/3309 [7:32:59<6:56:25, 16.00s/it] 53%|█████▎    | 1748/3309 [7:33:15<6:58:20, 16.08s/it] 53%|█████▎    | 1749/3309 [7:33:31<6:59:49, 16.15s/it] 53%|█████▎    | 1750/3309 [7:33:46<6:47:43, 15.69s/it]                                                       {'loss': 4.9996, 'grad_norm': 35.42136001586914, 'learning_rate': 4.777352446853863e-06, 'epoch': 0.53}
+ 53%|█████▎    | 1750/3309 [7:33:46<6:47:43, 15.69s/it] 53%|█████▎    | 1751/3309 [7:34:02<6:55:02, 15.98s/it] 53%|█████▎    | 1752/3309 [7:34:19<7:00:05, 16.19s/it] 53%|█████▎    | 1753/3309 [7:34:35<7:00:30, 16.21s/it] 53%|█████▎    | 1754/3309 [7:34:52<7:03:36, 16.35s/it] 53%|█████▎    | 1755/3309 [7:35:06<6:46:55, 15.71s/it] 53%|█████▎    | 1756/3309 [7:35:23<6:53:50, 15.99s/it] 53%|█████▎    | 1757/3309 [7:35:37<6:37:36, 15.37s/it] 53%|█████▎    | 1758/3309 [7:35:51<6:31:22, 15.14s/it] 53%|█████▎    | 1759/3309 [7:36:08<6:40:04, 15.49s/it] 53%|█████▎    | 1760/3309 [7:36:24<6:48:54, 15.84s/it]                                                       {'loss': 3.509, 'grad_norm': 23.063594818115234, 'learning_rate': 4.72846273808533e-06, 'epoch': 0.53}
+ 53%|█████▎    | 1760/3309 [7:36:24<6:48:54, 15.84s/it] 53%|█████▎    | 1761/3309 [7:36:41<6:53:26, 16.03s/it] 53%|█████▎    | 1762/3309 [7:36:57<6:56:05, 16.14s/it] 53%|█████▎    | 1763/3309 [7:37:14<7:01:17, 16.35s/it] 53%|█████▎    | 1764/3309 [7:37:30<6:55:06, 16.12s/it] 53%|█████▎    | 1765/3309 [7:37:46<6:56:34, 16.19s/it] 53%|█████▎    | 1766/3309 [7:38:00<6:41:22, 15.61s/it] 53%|█████▎    | 1767/3309 [7:38:17<6:46:56, 15.83s/it] 53%|█████▎    | 1768/3309 [7:38:33<6:52:44, 16.07s/it] 53%|█████▎    | 1769/3309 [7:38:50<6:54:32, 16.15s/it] 53%|█████▎    | 1770/3309 [7:39:06<6:55:47, 16.21s/it]                                                       {'loss': 3.3899, 'grad_norm': 21.706233978271484, 'learning_rate': 4.679599054049458e-06, 'epoch': 0.53}
+ 53%|█████▎    | 1770/3309 [7:39:06<6:55:47, 16.21s/it] 54%|█████▎    | 1771/3309 [7:39:20<6:37:49, 15.52s/it] 54%|█████▎    | 1772/3309 [7:39:34<6:29:34, 15.21s/it] 54%|█████▎    | 1773/3309 [7:39:49<6:24:10, 15.01s/it] 54%|█████▎    | 1774/3309 [7:40:03<6:18:31, 14.80s/it] 54%|█████▎    | 1775/3309 [7:40:18<6:17:34, 14.77s/it] 54%|█████▎    | 1776/3309 [7:40:32<6:10:18, 14.49s/it] 54%|█████▎    | 1777/3309 [7:40:46<6:08:03, 14.41s/it] 54%|█████▎    | 1778/3309 [7:41:02<6:24:10, 15.06s/it] 54%|█████▍    | 1779/3309 [7:41:19<6:33:21, 15.43s/it] 54%|█████▍    | 1780/3309 [7:41:33<6:23:48, 15.06s/it]                                                       {'loss': 5.9861, 'grad_norm': 20.82579231262207, 'learning_rate': 4.630766077949965e-06, 'epoch': 0.54}
+ 54%|█████▍    | 1780/3309 [7:41:33<6:23:48, 15.06s/it] 54%|█████▍    | 1781/3309 [7:41:49<6:34:12, 15.48s/it] 54%|█████▍    | 1782/3309 [7:42:06<6:40:26, 15.73s/it] 54%|█████▍    | 1783/3309 [7:42:20<6:28:38, 15.28s/it] 54%|█████▍    | 1784/3309 [7:42:34<6:22:11, 15.04s/it] 54%|█████▍    | 1785/3309 [7:42:51<6:31:28, 15.41s/it] 54%|█████▍    | 1786/3309 [7:43:05<6:21:47, 15.04s/it] 54%|█████▍    | 1787/3309 [7:43:19<6:15:00, 14.78s/it] 54%|█████▍    | 1788/3309 [7:43:33<6:10:19, 14.61s/it] 54%|█████▍    | 1789/3309 [7:43:50<6:25:34, 15.22s/it] 54%|█████▍    | 1790/3309 [7:44:04<6:20:05, 15.01s/it]                                                       {'loss': 4.3172, 'grad_norm': 32.06898880004883, 'learning_rate': 4.5819684900474484e-06, 'epoch': 0.54}
+ 54%|█████▍    | 1790/3309 [7:44:04<6:20:05, 15.01s/it] 54%|█████▍    | 1791/3309 [7:44:18<6:11:34, 14.69s/it] 54%|█████▍    | 1792/3309 [7:44:35<6:26:03, 15.27s/it] 54%|█████▍    | 1793/3309 [7:44:49<6:18:12, 14.97s/it] 54%|█████▍    | 1794/3309 [7:45:04<6:14:27, 14.83s/it] 54%|█████▍    | 1795/3309 [7:45:18<6:11:18, 14.71s/it] 54%|█████▍    | 1796/3309 [7:45:35<6:22:59, 15.19s/it] 54%|█████▍    | 1797/3309 [7:45:49<6:15:46, 14.91s/it] 54%|█████▍    | 1798/3309 [7:46:07<6:43:39, 16.03s/it] 54%|█████▍    | 1799/3309 [7:46:22<6:33:01, 15.62s/it] 54%|█████▍    | 1800/3309 [7:46:39<6:40:43, 15.93s/it]                                                       {'loss': 4.4365, 'grad_norm': 16.330984115600586, 'learning_rate': 4.5332109672108245e-06, 'epoch': 0.54}
+ 54%|█████▍    | 1800/3309 [7:46:39<6:40:43, 15.93s/it] 54%|█████▍    | 1801/3309 [7:46:53<6:30:45, 15.55s/it] 54%|█████▍    | 1802/3309 [7:47:07<6:18:09, 15.06s/it] 54%|█████▍    | 1803/3309 [7:47:24<6:30:16, 15.55s/it] 55%|█████▍    | 1804/3309 [7:47:40<6:35:43, 15.78s/it] 55%|█████▍    | 1805/3309 [7:47:57<6:42:19, 16.05s/it] 55%|█████▍    | 1806/3309 [7:48:13<6:44:08, 16.13s/it] 55%|█████▍    | 1807/3309 [7:48:28<6:29:17, 15.55s/it] 55%|█████▍    | 1808/3309 [7:48:44<6:35:00, 15.79s/it] 55%|█████▍    | 1809/3309 [7:48:58<6:20:52, 15.24s/it] 55%|█████▍    | 1810/3309 [7:49:14<6:29:03, 15.57s/it]                                                       {'loss': 3.6319, 'grad_norm': 17.189834594726562, 'learning_rate': 4.484498182469085e-06, 'epoch': 0.55}
+ 55%|█████▍    | 1810/3309 [7:49:14<6:29:03, 15.57s/it] 55%|█████▍    | 1811/3309 [7:49:30<6:34:08, 15.79s/it] 55%|█████▍    | 1812/3309 [7:49:45<6:24:21, 15.41s/it] 55%|█████▍    | 1813/3309 [7:50:00<6:18:41, 15.19s/it] 55%|█████▍    | 1814/3309 [7:50:14<6:15:20, 15.06s/it] 55%|█████▍    | 1815/3309 [7:50:31<6:26:38, 15.53s/it] 55%|█████▍    | 1816/3309 [7:50:46<6:19:03, 15.23s/it] 55%|█████▍    | 1817/3309 [7:51:02<6:26:53, 15.56s/it] 55%|█████▍    | 1818/3309 [7:51:18<6:34:15, 15.87s/it] 55%|█████▍    | 1819/3309 [7:51:33<6:23:42, 15.45s/it] 55%|█████▌    | 1820/3309 [7:51:47<6:14:05, 15.07s/it]                                                       {'loss': 5.8999, 'grad_norm': 19.211336135864258, 'learning_rate': 4.435834804563422e-06, 'epoch': 0.55}
+ 55%|█████▌    | 1820/3309 [7:51:47<6:14:05, 15.07s/it] 55%|█████▌    | 1821/3309 [7:52:04<6:23:17, 15.46s/it] 55%|█████▌    | 1822/3309 [7:52:18<6:14:10, 15.10s/it] 55%|█████▌    | 1823/3309 [7:52:36<6:40:54, 16.19s/it] 55%|█████▌    | 1824/3309 [7:52:53<6:41:32, 16.22s/it] 55%|█████▌    | 1825/3309 [7:53:09<6:43:46, 16.33s/it] 55%|█████▌    | 1826/3309 [7:53:26<6:43:31, 16.33s/it] 55%|█████▌    | 1827/3309 [7:53:40<6:27:44, 15.70s/it] 55%|█████▌    | 1828/3309 [7:53:56<6:33:09, 15.93s/it] 55%|█████▌    | 1829/3309 [7:54:11<6:23:36, 15.55s/it] 55%|█████▌    | 1830/3309 [7:54:28<6:30:40, 15.85s/it]                                                       {'loss': 3.5792, 'grad_norm': 26.310638427734375, 'learning_rate': 4.387225497499767e-06, 'epoch': 0.55}
+ 55%|█████▌    | 1830/3309 [7:54:28<6:30:40, 15.85s/it] 55%|█████▌    | 1831/3309 [7:54:42<6:18:18, 15.36s/it] 55%|█████▌    | 1832/3309 [7:54:58<6:26:08, 15.69s/it] 55%|█████▌    | 1833/3309 [7:55:15<6:32:42, 15.96s/it] 55%|█████▌    | 1834/3309 [7:55:31<6:34:59, 16.07s/it] 55%|█████▌    | 1835/3309 [7:55:48<6:39:03, 16.24s/it] 55%|█████▌    | 1836/3309 [7:56:02<6:24:04, 15.64s/it] 56%|█████▌    | 1837/3309 [7:56:17<6:15:41, 15.31s/it] 56%|█████▌    | 1838/3309 [7:56:33<6:25:25, 15.72s/it] 56%|█████▌    | 1839/3309 [7:56:48<6:16:22, 15.36s/it] 56%|█████▌    | 1840/3309 [7:57:02<6:07:33, 15.01s/it]                                                       {'loss': 3.4555, 'grad_norm': 20.680715560913086, 'learning_rate': 4.3386749201017856e-06, 'epoch': 0.56}
+ 56%|█████▌    | 1840/3309 [7:57:02<6:07:33, 15.01s/it] 56%|█████▌    | 1841/3309 [7:57:18<6:17:07, 15.41s/it] 56%|█████▌    | 1842/3309 [7:57:33<6:08:35, 15.08s/it] 56%|█████▌    | 1843/3309 [7:57:49<6:17:05, 15.43s/it] 56%|█████▌    | 1844/3309 [7:58:05<6:22:31, 15.67s/it] 56%|█████▌    | 1845/3309 [7:58:20<6:13:43, 15.32s/it] 56%|█████▌    | 1846/3309 [7:58:36<6:18:37, 15.53s/it] 56%|█████▌    | 1847/3309 [7:58:52<6:23:51, 15.75s/it] 56%|█████▌    | 1848/3309 [7:59:06<6:13:43, 15.35s/it] 56%|█████▌    | 1849/3309 [7:59:21<6:05:05, 15.00s/it] 56%|█████▌    | 1850/3309 [7:59:37<6:14:22, 15.40s/it]                                                       {'loss': 6.0278, 'grad_norm': 15.533769607543945, 'learning_rate': 4.290187725564356e-06, 'epoch': 0.56}
+ 56%|█████▌    | 1850/3309 [7:59:37<6:14:22, 15.40s/it] 56%|█████▌    | 1851/3309 [7:59:54<6:23:27, 15.78s/it] 56%|█████▌    | 1852/3309 [8:00:08<6:11:46, 15.31s/it] 56%|█████▌    | 1853/3309 [8:00:22<6:01:52, 14.91s/it] 56%|█████▌    | 1854/3309 [8:00:36<5:56:19, 14.69s/it] 56%|█████▌    | 1855/3309 [8:00:50<5:54:43, 14.64s/it] 56%|█████▌    | 1856/3309 [8:01:05<5:51:15, 14.50s/it] 56%|█████▌    | 1857/3309 [8:01:21<6:06:23, 15.14s/it] 56%|█████▌    | 1858/3309 [8:01:40<6:31:57, 16.21s/it] 56%|█████▌    | 1859/3309 [8:01:54<6:17:25, 15.62s/it] 56%|█████▌    | 1860/3309 [8:02:11<6:22:17, 15.83s/it]                                                       {'loss': 3.4758, 'grad_norm': 13.684257507324219, 'learning_rate': 4.2417685610076135e-06, 'epoch': 0.56}
+ 56%|█████▌    | 1860/3309 [8:02:11<6:22:17, 15.83s/it] 56%|█████▌    | 1861/3309 [8:02:25<6:12:32, 15.44s/it] 56%|█████▋    | 1862/3309 [8:02:40<6:06:54, 15.21s/it] 56%|█████▋    | 1863/3309 [8:02:54<5:58:07, 14.86s/it] 56%|█████▋    | 1864/3309 [8:03:10<6:08:19, 15.29s/it] 56%|█████▋    | 1865/3309 [8:03:27<6:17:22, 15.68s/it] 56%|█████▋    | 1866/3309 [8:03:43<6:21:37, 15.87s/it] 56%|█████▋    | 1867/3309 [8:03:57<6:09:26, 15.37s/it] 56%|█████▋    | 1868/3309 [8:04:13<6:16:04, 15.66s/it] 56%|█████▋    | 1869/3309 [8:04:28<6:05:40, 15.24s/it] 57%|█████▋    | 1870/3309 [8:04:45<6:18:06, 15.77s/it]                                                       {'loss': 4.3166, 'grad_norm': 15.711587905883789, 'learning_rate': 4.193422067031535e-06, 'epoch': 0.57}
+ 57%|█████▋    | 1870/3309 [8:04:45<6:18:06, 15.77s/it] 57%|█████▋    | 1871/3309 [8:04:59<6:06:46, 15.30s/it] 57%|█████▋    | 1872/3309 [8:05:16<6:16:02, 15.70s/it] 57%|█████▋    | 1873/3309 [8:05:30<6:04:58, 15.25s/it] 57%|█████▋    | 1874/3309 [8:05:44<6:00:34, 15.08s/it] 57%|█████▋    | 1875/3309 [8:06:01<6:09:32, 15.46s/it] 57%|█████▋    | 1876/3309 [8:06:15<6:01:54, 15.15s/it] 57%|█████▋    | 1877/3309 [8:06:29<5:54:40, 14.86s/it] 57%|█████▋    | 1878/3309 [8:06:46<6:10:09, 15.52s/it] 57%|█████▋    | 1879/3309 [8:07:03<6:15:51, 15.77s/it] 57%|█████▋    | 1880/3309 [8:07:19<6:19:25, 15.93s/it]                                                       {'loss': 4.1625, 'grad_norm': 18.764991760253906, 'learning_rate': 4.145152877271196e-06, 'epoch': 0.57}
+ 57%|█████▋    | 1880/3309 [8:07:19<6:19:25, 15.93s/it] 57%|█████▋    | 1881/3309 [8:07:33<6:06:41, 15.41s/it] 57%|█████▋    | 1882/3309 [8:07:50<6:18:19, 15.91s/it] 57%|█████▋    | 1883/3309 [8:08:07<6:21:26, 16.05s/it] 57%|█████▋    | 1884/3309 [8:08:21<6:07:51, 15.49s/it] 57%|█████▋    | 1885/3309 [8:08:36<6:01:35, 15.24s/it] 57%|█████▋    | 1886/3309 [8:08:52<6:08:46, 15.55s/it] 57%|█████▋    | 1887/3309 [8:09:08<6:13:22, 15.75s/it] 57%|█████▋    | 1888/3309 [8:09:24<6:17:16, 15.93s/it] 57%|█████▋    | 1889/3309 [8:09:39<6:07:21, 15.52s/it] 57%|█████▋    | 1890/3309 [8:09:55<6:12:55, 15.77s/it]                                                       {'loss': 4.4233, 'grad_norm': 19.19873809814453, 'learning_rate': 4.096965617952667e-06, 'epoch': 0.57}
+ 57%|█████▋    | 1890/3309 [8:09:55<6:12:55, 15.77s/it] 57%|█████▋    | 1891/3309 [8:10:12<6:16:55, 15.95s/it] 57%|█████▋    | 1892/3309 [8:10:28<6:18:56, 16.05s/it] 57%|█████▋    | 1893/3309 [8:10:44<6:20:46, 16.13s/it] 57%|█████▋    | 1894/3309 [8:11:01<6:24:15, 16.29s/it] 57%|█████▋    | 1895/3309 [8:11:17<6:23:58, 16.29s/it] 57%|█████▋    | 1896/3309 [8:11:34<6:23:42, 16.29s/it] 57%|█████▋    | 1897/3309 [8:11:50<6:23:29, 16.30s/it] 57%|█████▋    | 1898/3309 [8:12:04<6:10:34, 15.76s/it] 57%|█████▋    | 1899/3309 [8:12:21<6:16:33, 16.02s/it] 57%|█████▋    | 1900/3309 [8:12:37<6:17:51, 16.09s/it]                                                       {'loss': 3.5268, 'grad_norm': 20.817365646362305, 'learning_rate': 4.048864907449619e-06, 'epoch': 0.57}
+ 57%|█████▋    | 1900/3309 [8:12:37<6:17:51, 16.09s/it] 57%|█████▋    | 1901/3309 [8:12:56<6:35:45, 16.86s/it] 57%|█████▋    | 1902/3309 [8:13:10<6:18:19, 16.13s/it] 58%|█████▊    | 1903/3309 [8:13:25<6:04:20, 15.55s/it] 58%|█████▊    | 1904/3309 [8:13:39<5:54:56, 15.16s/it] 58%|█████▊    | 1905/3309 [8:13:53<5:47:49, 14.86s/it] 58%|█████▊    | 1906/3309 [8:14:09<5:58:09, 15.32s/it] 58%|█████▊    | 1907/3309 [8:14:26<6:05:12, 15.63s/it] 58%|█████▊    | 1908/3309 [8:14:40<5:55:08, 15.21s/it] 58%|█████▊    | 1909/3309 [8:14:56<6:02:12, 15.52s/it] 58%|█████▊    | 1910/3309 [8:15:13<6:09:48, 15.86s/it]                                                       {'loss': 3.5747, 'grad_norm': 18.440645217895508, 'learning_rate': 4.000855355840695e-06, 'epoch': 0.58}
+ 58%|█████▊    | 1910/3309 [8:15:13<6:09:48, 15.86s/it] 58%|█████▊    | 1911/3309 [8:15:27<5:59:33, 15.43s/it] 58%|█████▊    | 1912/3309 [8:15:42<5:50:58, 15.07s/it] 58%|█████▊    | 1913/3309 [8:15:56<5:45:00, 14.83s/it] 58%|█████▊    | 1914/3309 [8:16:12<5:55:15, 15.28s/it] 58%|█████▊    | 1915/3309 [8:16:26<5:45:29, 14.87s/it] 58%|█████▊    | 1916/3309 [8:16:40<5:40:49, 14.68s/it] 58%|█████▊    | 1917/3309 [8:16:57<5:53:25, 15.23s/it] 58%|█████▊    | 1918/3309 [8:17:11<5:49:14, 15.06s/it] 58%|█████▊    | 1919/3309 [8:17:28<5:59:45, 15.53s/it] 58%|█████▊    | 1920/3309 [8:17:44<6:04:45, 15.76s/it]                                                       {'loss': 4.2257, 'grad_norm': 15.997143745422363, 'learning_rate': 3.952941564467665e-06, 'epoch': 0.58}
+ 58%|█████▊    | 1920/3309 [8:17:44<6:04:45, 15.76s/it] 58%|█████▊    | 1921/3309 [8:18:01<6:08:16, 15.92s/it] 58%|█████▊    | 1922/3309 [8:18:15<5:56:40, 15.43s/it] 58%|█████▊    | 1923/3309 [8:18:30<5:54:06, 15.33s/it] 58%|█████▊    | 1924/3309 [8:18:45<5:49:09, 15.13s/it] 58%|█████▊    | 1925/3309 [8:19:01<5:57:00, 15.48s/it] 58%|█████▊    | 1926/3309 [8:19:15<5:47:32, 15.08s/it] 58%|█████▊    | 1927/3309 [8:19:31<5:55:29, 15.43s/it] 58%|█████▊    | 1928/3309 [8:19:48<6:01:45, 15.72s/it] 58%|█████▊    | 1929/3309 [8:20:02<5:53:13, 15.36s/it] 58%|█████▊    | 1930/3309 [8:20:19<5:59:24, 15.64s/it]                                                       {'loss': 4.3136, 'grad_norm': 20.629562377929688, 'learning_rate': 3.905128125494427e-06, 'epoch': 0.58}
+ 58%|█████▊    | 1930/3309 [8:20:19<5:59:24, 15.64s/it] 58%|█████▊    | 1931/3309 [8:20:33<5:49:12, 15.20s/it] 58%|█████▊    | 1932/3309 [8:20:49<5:59:01, 15.64s/it] 58%|█████▊    | 1933/3309 [8:21:04<5:48:48, 15.21s/it] 58%|█████▊    | 1934/3309 [8:21:20<5:56:12, 15.54s/it] 58%|█████▊    | 1935/3309 [8:21:35<5:49:49, 15.28s/it] 59%|█████▊    | 1936/3309 [8:21:51<5:56:46, 15.59s/it] 59%|█████▊    | 1937/3309 [8:22:05<5:46:37, 15.16s/it] 59%|█████▊    | 1938/3309 [8:22:19<5:39:36, 14.86s/it] 59%|█████▊    | 1939/3309 [8:22:36<5:49:17, 15.30s/it] 59%|█████▊    | 1940/3309 [8:22:50<5:44:18, 15.09s/it]                                                       {'loss': 4.509, 'grad_norm': 33.730995178222656, 'learning_rate': 3.8574196214668876e-06, 'epoch': 0.59}
+ 59%|█████▊    | 1940/3309 [8:22:50<5:44:18, 15.09s/it] 59%|█████▊    | 1941/3309 [8:23:05<5:39:13, 14.88s/it] 59%|█████▊    | 1942/3309 [8:23:19<5:38:42, 14.87s/it] 59%|█████▊    | 1943/3309 [8:23:38<6:05:25, 16.05s/it] 59%|█████▊    | 1944/3309 [8:23:52<5:52:23, 15.49s/it] 59%|█████▉    | 1945/3309 [8:24:09<5:58:03, 15.75s/it] 59%|█████▉    | 1946/3309 [8:24:23<5:47:27, 15.30s/it] 59%|█████▉    | 1947/3309 [8:24:39<5:53:59, 15.59s/it] 59%|█████▉    | 1948/3309 [8:24:54<5:44:10, 15.17s/it] 59%|█████▉    | 1949/3309 [8:25:10<5:51:35, 15.51s/it] 59%|█████▉    | 1950/3309 [8:25:24<5:44:18, 15.20s/it]                                                       {'loss': 5.139, 'grad_norm': 30.045576095581055, 'learning_rate': 3.8098206248737486e-06, 'epoch': 0.59}
+ 59%|█████▉    | 1950/3309 [8:25:24<5:44:18, 15.20s/it] 59%|█████▉    | 1951/3309 [8:25:39<5:37:20, 14.90s/it] 59%|█████▉    | 1952/3309 [8:25:55<5:46:21, 15.31s/it] 59%|█████▉    | 1953/3309 [8:26:11<5:52:56, 15.62s/it] 59%|█████▉    | 1954/3309 [8:26:25<5:43:20, 15.20s/it] 59%|█████▉    | 1955/3309 [8:26:42<5:55:16, 15.74s/it] 59%|█████▉    | 1956/3309 [8:26:57<5:44:25, 15.27s/it] 59%|█████▉    | 1957/3309 [8:27:10<5:35:18, 14.88s/it] 59%|█████▉    | 1958/3309 [8:27:27<5:44:01, 15.28s/it] 59%|█████▉    | 1959/3309 [8:27:43<5:50:15, 15.57s/it] 59%|█████▉    | 1960/3309 [8:27:59<5:54:54, 15.79s/it]                                                       {'loss': 2.5913, 'grad_norm': 23.693470001220703, 'learning_rate': 3.7623356977082794e-06, 'epoch': 0.59}
+ 59%|█████▉    | 1960/3309 [8:27:59<5:54:54, 15.79s/it] 59%|█████▉    | 1961/3309 [8:28:13<5:43:31, 15.29s/it] 59%|█████▉    | 1962/3309 [8:28:28<5:37:53, 15.05s/it] 59%|█████▉    | 1963/3309 [8:28:42<5:31:50, 14.79s/it] 59%|█████▉    | 1964/3309 [8:28:57<5:30:55, 14.76s/it] 59%|█████▉    | 1965/3309 [8:29:11<5:26:55, 14.59s/it] 59%|█████▉    | 1966/3309 [8:29:27<5:38:31, 15.12s/it] 59%|█████▉    | 1967/3309 [8:29:41<5:30:22, 14.77s/it] 59%|█████▉    | 1968/3309 [8:29:56<5:28:05, 14.68s/it] 60%|█████▉    | 1969/3309 [8:30:12<5:38:53, 15.17s/it] 60%|█████▉    | 1970/3309 [8:30:29<5:48:36, 15.62s/it]                                                       {'loss': 4.3328, 'grad_norm': 18.655092239379883, 'learning_rate': 3.714969391031084e-06, 'epoch': 0.6}
+ 60%|█████▉    | 1970/3309 [8:30:29<5:48:36, 15.62s/it] 60%|█████▉    | 1971/3309 [8:30:44<5:44:20, 15.44s/it] 60%|█████▉    | 1972/3309 [8:31:02<6:06:16, 16.44s/it] 60%|█████▉    | 1973/3309 [8:31:19<6:07:18, 16.50s/it] 60%|█████▉    | 1974/3309 [8:31:33<5:51:31, 15.80s/it] 60%|█████▉    | 1975/3309 [8:31:52<6:10:50, 16.68s/it] 60%|█████▉    | 1976/3309 [8:32:09<6:10:09, 16.66s/it] 60%|█████▉    | 1977/3309 [8:32:23<5:56:12, 16.05s/it] 60%|█████▉    | 1978/3309 [8:32:40<5:57:36, 16.12s/it] 60%|█████▉    | 1979/3309 [8:32:56<5:57:34, 16.13s/it] 60%|█████▉    | 1980/3309 [8:33:12<6:00:48, 16.29s/it]                                                       {'loss': 3.5691, 'grad_norm': 15.45345687866211, 'learning_rate': 3.6677262445339136e-06, 'epoch': 0.6}
+ 60%|█████▉    | 1980/3309 [8:33:12<6:00:48, 16.29s/it] 60%|█████▉    | 1981/3309 [8:33:29<6:00:33, 16.29s/it] 60%|█████▉    | 1982/3309 [8:33:45<6:02:27, 16.39s/it] 60%|█████▉    | 1983/3309 [8:34:02<6:03:33, 16.45s/it] 60%|█████▉    | 1984/3309 [8:34:16<5:48:31, 15.78s/it] 60%|█████▉    | 1985/3309 [8:34:33<5:54:14, 16.05s/it] 60%|██████    | 1986/3309 [8:34:49<5:55:18, 16.11s/it] 60%|██████    | 1987/3309 [8:35:05<5:56:54, 16.20s/it] 60%|██████    | 1988/3309 [8:35:22<5:57:27, 16.24s/it] 60%|██████    | 1989/3309 [8:35:38<5:57:07, 16.23s/it] 60%|██████    | 1990/3309 [8:35:55<5:59:32, 16.35s/it]                                                       {'loss': 2.5934, 'grad_norm': 21.302995681762695, 'learning_rate': 3.6206107861045803e-06, 'epoch': 0.6}
+ 60%|██████    | 1990/3309 [8:35:55<5:59:32, 16.35s/it] 60%|██████    | 1991/3309 [8:36:11<5:59:18, 16.36s/it] 60%|██████    | 1992/3309 [8:36:27<5:59:21, 16.37s/it] 60%|██████    | 1993/3309 [8:36:41<5:42:42, 15.62s/it] 60%|██████    | 1994/3309 [8:36:55<5:31:21, 15.12s/it] 60%|██████    | 1995/3309 [8:37:10<5:28:09, 14.98s/it] 60%|██████    | 1996/3309 [8:37:24<5:23:04, 14.76s/it] 60%|██████    | 1997/3309 [8:37:38<5:17:15, 14.51s/it] 60%|██████    | 1998/3309 [8:37:52<5:14:56, 14.41s/it] 60%|██████    | 1999/3309 [8:38:07<5:16:24, 14.49s/it] 60%|██████    | 2000/3309 [8:38:23<5:27:54, 15.03s/it]                                                       {'loss': 4.3405, 'grad_norm': 13.75935173034668, 'learning_rate': 3.5736275313929826e-06, 'epoch': 0.6}
+ 60%|██████    | 2000/3309 [8:38:23<5:27:54, 15.03s/it]/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+ 60%|██████    | 2001/3309 [8:39:28<10:50:37, 29.85s/it] 61%|██████    | 2002/3309 [8:39:42<9:09:52, 25.24s/it]  61%|██████    | 2003/3309 [8:39:58<8:11:26, 22.58s/it] 61%|██████    | 2004/3309 [8:40:15<7:30:28, 20.71s/it] 61%|██████    | 2005/3309 [8:40:31<7:01:14, 19.38s/it] 61%|██████    | 2006/3309 [8:40:46<6:30:11, 17.97s/it] 61%|██████    | 2007/3309 [8:41:02<6:19:16, 17.48s/it] 61%|██████    | 2008/3309 [8:41:18<6:11:42, 17.14s/it] 61%|██████    | 2009/3309 [8:41:35<6:06:29, 16.91s/it] 61%|██████    | 2010/3309 [8:41:51<6:03:57, 16.81s/it]                                                       {'loss': 4.8443, 'grad_norm': 17.593429565429688, 'learning_rate': 3.5267809833783213e-06, 'epoch': 0.61}
+ 61%|██████    | 2010/3309 [8:41:51<6:03:57, 16.81s/it] 61%|██████    | 2011/3309 [8:42:08<6:00:53, 16.68s/it] 61%|██████    | 2012/3309 [8:42:24<5:58:30, 16.59s/it] 61%|██████    | 2013/3309 [8:42:41<5:58:47, 16.61s/it] 61%|██████    | 2014/3309 [8:42:56<5:46:13, 16.04s/it] 61%|██████    | 2015/3309 [8:43:12<5:47:40, 16.12s/it] 61%|██████    | 2016/3309 [8:43:28<5:49:00, 16.20s/it] 61%|██████    | 2017/3309 [8:43:45<5:51:26, 16.32s/it] 61%|██████    | 2018/3309 [8:44:01<5:52:49, 16.40s/it] 61%|██████    | 2019/3309 [8:44:18<5:54:12, 16.47s/it] 61%|██████    | 2020/3309 [8:44:35<5:55:00, 16.53s/it]                                                       {'loss': 3.4879, 'grad_norm': 23.467853546142578, 'learning_rate': 3.4800756319375326e-06, 'epoch': 0.61}
+ 61%|██████    | 2020/3309 [8:44:35<5:55:00, 16.53s/it] 61%|██████    | 2021/3309 [8:44:49<5:39:32, 15.82s/it] 61%|██████    | 2022/3309 [8:45:06<5:44:56, 16.08s/it] 61%|██████    | 2023/3309 [8:45:22<5:48:06, 16.24s/it] 61%|██████    | 2024/3309 [8:45:36<5:34:55, 15.64s/it] 61%|██████    | 2025/3309 [8:45:50<5:23:45, 15.13s/it] 61%|██████    | 2026/3309 [8:46:07<5:31:23, 15.50s/it] 61%|██████▏   | 2027/3309 [8:46:21<5:22:48, 15.11s/it] 61%|██████▏   | 2028/3309 [8:46:35<5:16:58, 14.85s/it] 61%|██████▏   | 2029/3309 [8:46:49<5:12:43, 14.66s/it] 61%|██████▏   | 2030/3309 [8:47:04<5:09:37, 14.52s/it]                                                       {'loss': 2.7966, 'grad_norm': 25.12725830078125, 'learning_rate': 3.433515953414953e-06, 'epoch': 0.61}
+ 61%|██████▏   | 2030/3309 [8:47:04<5:09:37, 14.52s/it] 61%|██████▏   | 2031/3309 [8:47:18<5:06:49, 14.40s/it] 61%|██████▏   | 2032/3309 [8:47:32<5:08:00, 14.47s/it] 61%|██████▏   | 2033/3309 [8:47:49<5:18:47, 14.99s/it] 61%|██████▏   | 2034/3309 [8:48:05<5:29:03, 15.49s/it] 61%|██████▏   | 2035/3309 [8:48:21<5:33:58, 15.73s/it] 62%|██████▏   | 2036/3309 [8:48:38<5:37:18, 15.90s/it] 62%|██████▏   | 2037/3309 [8:48:52<5:27:14, 15.44s/it] 62%|██████▏   | 2038/3309 [8:49:06<5:18:56, 15.06s/it] 62%|██████▏   | 2039/3309 [8:49:21<5:14:25, 14.85s/it] 62%|██████▏   | 2040/3309 [8:49:35<5:12:09, 14.76s/it]                                                       {'loss': 5.8078, 'grad_norm': 33.0245475769043, 'learning_rate': 3.387106410193308e-06, 'epoch': 0.62}
+ 62%|██████▏   | 2040/3309 [8:49:35<5:12:09, 14.76s/it] 62%|██████▏   | 2041/3309 [8:49:53<5:28:23, 15.54s/it] 62%|██████▏   | 2042/3309 [8:50:07<5:19:39, 15.14s/it] 62%|██████▏   | 2043/3309 [8:50:23<5:27:28, 15.52s/it] 62%|██████▏   | 2044/3309 [8:50:40<5:34:25, 15.86s/it] 62%|██████▏   | 2045/3309 [8:50:54<5:26:23, 15.49s/it] 62%|██████▏   | 2046/3309 [8:51:09<5:21:04, 15.25s/it] 62%|██████▏   | 2047/3309 [8:51:25<5:27:27, 15.57s/it] 62%|██████▏   | 2048/3309 [8:51:40<5:20:44, 15.26s/it] 62%|██████▏   | 2049/3309 [8:51:54<5:13:56, 14.95s/it] 62%|██████▏   | 2050/3309 [8:52:10<5:21:53, 15.34s/it]                                                       {'loss': 5.2049, 'grad_norm': 18.8001651763916, 'learning_rate': 3.3408514502660195e-06, 'epoch': 0.62}
+ 62%|██████▏   | 2050/3309 [8:52:10<5:21:53, 15.34s/it] 62%|██████▏   | 2051/3309 [8:52:25<5:16:05, 15.08s/it] 62%|██████▏   | 2052/3309 [8:52:39<5:12:05, 14.90s/it] 62%|██████▏   | 2053/3309 [8:52:58<5:36:04, 16.05s/it] 62%|██████▏   | 2054/3309 [8:53:17<5:52:06, 16.83s/it] 62%|██████▏   | 2055/3309 [8:53:31<5:33:33, 15.96s/it] 62%|██████▏   | 2056/3309 [8:53:47<5:35:34, 16.07s/it] 62%|██████▏   | 2057/3309 [8:54:01<5:23:43, 15.51s/it] 62%|██████▏   | 2058/3309 [8:54:18<5:28:18, 15.75s/it] 62%|██████▏   | 2059/3309 [8:54:32<5:20:37, 15.39s/it] 62%|██████▏   | 2060/3309 [8:54:46<5:12:59, 15.04s/it]                                                       {'loss': 3.3988, 'grad_norm': 16.787553787231445, 'learning_rate': 3.2947555068109057e-06, 'epoch': 0.62}
+ 62%|██████▏   | 2060/3309 [8:54:46<5:12:59, 15.04s/it] 62%|██████▏   | 2061/3309 [8:55:01<5:07:32, 14.79s/it] 62%|██████▏   | 2062/3309 [8:55:15<5:03:49, 14.62s/it] 62%|██████▏   | 2063/3309 [8:55:29<5:00:49, 14.49s/it] 62%|██████▏   | 2064/3309 [8:55:45<5:11:59, 15.04s/it] 62%|██████▏   | 2065/3309 [8:56:02<5:21:51, 15.52s/it] 62%|██████▏   | 2066/3309 [8:56:18<5:26:16, 15.75s/it] 62%|██████▏   | 2067/3309 [8:56:32<5:14:33, 15.20s/it] 62%|██████▏   | 2068/3309 [8:56:49<5:22:40, 15.60s/it] 63%|██████▎   | 2069/3309 [8:57:05<5:28:53, 15.91s/it] 63%|██████▎   | 2070/3309 [8:57:22<5:31:04, 16.03s/it]                                                       {'loss': 2.815, 'grad_norm': 21.532262802124023, 'learning_rate': 3.248822997765295e-06, 'epoch': 0.63}
+ 63%|██████▎   | 2070/3309 [8:57:22<5:31:04, 16.03s/it] 63%|██████▎   | 2071/3309 [8:57:38<5:33:03, 16.14s/it] 63%|██████▎   | 2072/3309 [8:57:54<5:32:15, 16.12s/it] 63%|██████▎   | 2073/3309 [8:58:08<5:18:10, 15.45s/it] 63%|██████▎   | 2074/3309 [8:58:22<5:10:01, 15.06s/it] 63%|██████▎   | 2075/3309 [8:58:37<5:07:10, 14.94s/it] 63%|██████▎   | 2076/3309 [8:58:51<5:02:22, 14.71s/it] 63%|██████▎   | 2077/3309 [8:59:07<5:12:08, 15.20s/it] 63%|██████▎   | 2078/3309 [8:59:22<5:08:22, 15.03s/it] 63%|██████▎   | 2079/3309 [8:59:36<5:03:15, 14.79s/it] 63%|██████▎   | 2080/3309 [8:59:52<5:11:58, 15.23s/it]                                                       {'loss': 4.3332, 'grad_norm': 24.630603790283203, 'learning_rate': 3.203058325402599e-06, 'epoch': 0.63}
+ 63%|██████▎   | 2080/3309 [8:59:52<5:11:58, 15.23s/it] 63%|██████▎   | 2081/3309 [9:00:07<5:07:48, 15.04s/it] 63%|██████▎   | 2082/3309 [9:00:21<5:00:57, 14.72s/it] 63%|██████▎   | 2083/3309 [9:00:37<5:09:53, 15.17s/it] 63%|██████▎   | 2084/3309 [9:00:54<5:18:46, 15.61s/it] 63%|██████▎   | 2085/3309 [9:01:10<5:23:23, 15.85s/it] 63%|██████▎   | 2086/3309 [9:01:27<5:26:28, 16.02s/it] 63%|██████▎   | 2087/3309 [9:01:43<5:28:29, 16.13s/it] 63%|██████▎   | 2088/3309 [9:01:57<5:16:39, 15.56s/it] 63%|██████▎   | 2089/3309 [9:02:14<5:22:46, 15.87s/it] 63%|██████▎   | 2090/3309 [9:02:30<5:24:34, 15.98s/it]                                                       {'loss': 4.3038, 'grad_norm': 16.667922973632812, 'learning_rate': 3.1574658759103904e-06, 'epoch': 0.63}
+ 63%|██████▎   | 2090/3309 [9:02:30<5:24:34, 15.98s/it] 63%|██████▎   | 2091/3309 [9:02:44<5:11:21, 15.34s/it] 63%|██████▎   | 2092/3309 [9:03:01<5:19:03, 15.73s/it] 63%|██████▎   | 2093/3309 [9:03:17<5:24:21, 16.00s/it] 63%|██████▎   | 2094/3309 [9:03:31<5:10:30, 15.33s/it] 63%|██████▎   | 2095/3309 [9:03:47<5:16:06, 15.62s/it] 63%|██████▎   | 2096/3309 [9:04:04<5:22:02, 15.93s/it] 63%|██████▎   | 2097/3309 [9:04:20<5:24:17, 16.05s/it] 63%|██████▎   | 2098/3309 [9:04:37<5:26:06, 16.16s/it] 63%|██████▎   | 2099/3309 [9:04:51<5:14:26, 15.59s/it] 63%|██████▎   | 2100/3309 [9:05:07<5:19:05, 15.84s/it]                                                       {'loss': 3.4132, 'grad_norm': 20.671772003173828, 'learning_rate': 3.1120500189700204e-06, 'epoch': 0.63}
+ 63%|██████▎   | 2100/3309 [9:05:07<5:19:05, 15.84s/it] 63%|██████▎   | 2101/3309 [9:05:24<5:23:49, 16.08s/it] 64%|██████▎   | 2102/3309 [9:05:41<5:27:04, 16.26s/it] 64%|██████▎   | 2103/3309 [9:05:57<5:27:01, 16.27s/it] 64%|██████▎   | 2104/3309 [9:06:13<5:27:23, 16.30s/it] 64%|██████▎   | 2105/3309 [9:06:28<5:14:30, 15.67s/it] 64%|██████▎   | 2106/3309 [9:06:42<5:07:32, 15.34s/it] 64%|██████▎   | 2107/3309 [9:06:56<5:00:21, 14.99s/it] 64%|██████▎   | 2108/3309 [9:07:11<4:58:10, 14.90s/it] 64%|███��██▎   | 2109/3309 [9:07:25<4:53:39, 14.68s/it] 64%|██████▍   | 2110/3309 [9:07:39<4:50:55, 14.56s/it]                                                       {'loss': 4.1988, 'grad_norm': 21.932987213134766, 'learning_rate': 3.066815107337815e-06, 'epoch': 0.64}
+ 64%|██████▍   | 2110/3309 [9:07:39<4:50:55, 14.56s/it] 64%|██████▍   | 2111/3309 [9:07:54<4:50:15, 14.54s/it] 64%|██████▍   | 2112/3309 [9:08:11<5:02:33, 15.17s/it] 64%|██████▍   | 2113/3309 [9:08:27<5:11:24, 15.62s/it] 64%|██████▍   | 2114/3309 [9:08:44<5:15:28, 15.84s/it] 64%|██████▍   | 2115/3309 [9:08:58<5:05:16, 15.34s/it] 64%|██████▍   | 2116/3309 [9:09:14<5:11:26, 15.66s/it] 64%|██████▍   | 2117/3309 [9:09:28<5:02:35, 15.23s/it] 64%|██████▍   | 2118/3309 [9:09:43<4:57:28, 14.99s/it] 64%|██████▍   | 2119/3309 [9:09:57<4:52:26, 14.74s/it] 64%|██████▍   | 2120/3309 [9:10:13<5:01:29, 15.21s/it]                                                       {'loss': 3.5937, 'grad_norm': 17.348411560058594, 'learning_rate': 3.0217654764279114e-06, 'epoch': 0.64}
+ 64%|██████▍   | 2120/3309 [9:10:13<5:01:29, 15.21s/it] 64%|██████▍   | 2121/3309 [9:10:28<4:56:21, 14.97s/it] 64%|██████▍   | 2122/3309 [9:10:42<4:54:28, 14.88s/it] 64%|██████▍   | 2123/3309 [9:10:59<5:03:13, 15.34s/it] 64%|██████▍   | 2124/3309 [9:11:13<4:56:14, 15.00s/it] 64%|██████▍   | 2125/3309 [9:11:28<4:53:48, 14.89s/it] 64%|██████▍   | 2126/3309 [9:11:42<4:49:46, 14.70s/it] 64%|██████▍   | 2127/3309 [9:11:58<4:59:16, 15.19s/it] 64%|██████▍   | 2128/3309 [9:12:13<4:55:30, 15.01s/it] 64%|██████▍   | 2129/3309 [9:12:29<5:03:18, 15.42s/it] 64%|██████▍   | 2130/3309 [9:12:43<4:55:45, 15.05s/it]                                                       {'loss': 5.9817, 'grad_norm': 25.625871658325195, 'learning_rate': 2.9769054438967192e-06, 'epoch': 0.64}
+ 64%|██████▍   | 2130/3309 [9:12:43<4:55:45, 15.05s/it] 64%|██████▍   | 2131/3309 [9:13:00<5:03:04, 15.44s/it] 64%|██████▍   | 2132/3309 [9:13:16<5:09:59, 15.80s/it] 64%|██████▍   | 2133/3309 [9:13:31<5:02:43, 15.44s/it] 64%|██████▍   | 2134/3309 [9:13:48<5:09:16, 15.79s/it] 65%|██████▍   | 2135/3309 [9:14:04<5:11:36, 15.93s/it] 65%|██████▍   | 2136/3309 [9:14:18<5:03:46, 15.54s/it] 65%|██████▍   | 2137/3309 [9:14:33<4:56:32, 15.18s/it] 65%|██████▍   | 2138/3309 [9:14:49<5:02:55, 15.52s/it] 65%|██████▍   | 2139/3309 [9:15:03<4:55:35, 15.16s/it] 65%|██████▍   | 2140/3309 [9:15:18<4:50:55, 14.93s/it]                                                       {'loss': 5.6772, 'grad_norm': 31.0660457611084, 'learning_rate': 2.9322393092291256e-06, 'epoch': 0.65}
+ 65%|██████▍   | 2140/3309 [9:15:18<4:50:55, 14.93s/it] 65%|██████▍   | 2141/3309 [9:15:34<4:59:19, 15.38s/it] 65%|██████▍   | 2142/3309 [9:15:49<4:54:07, 15.12s/it] 65%|██████▍   | 2143/3309 [9:16:04<4:52:28, 15.05s/it] 65%|██████▍   | 2144/3309 [9:16:20<5:01:21, 15.52s/it] 65%|██████▍   | 2145/3309 [9:16:35<4:53:23, 15.12s/it] 65%|██████▍   | 2146/3309 [9:16:48<4:45:53, 14.75s/it] 65%|██████▍   | 2147/3309 [9:17:07<5:07:25, 15.87s/it] 65%|██████▍   | 2148/3309 [9:17:23<5:10:07, 16.03s/it] 65%|██████▍   | 2149/3309 [9:17:38<5:01:56, 15.62s/it] 65%|██████▍   | 2150/3309 [9:17:54<5:05:53, 15.84s/it]                                                       {'loss': 4.2915, 'grad_norm': 20.511960983276367, 'learning_rate': 2.887771353326422e-06, 'epoch': 0.65}
+ 65%|██████▍   | 2150/3309 [9:17:54<5:05:53, 15.84s/it] 65%|██████▌   | 2151/3309 [9:18:11<5:08:53, 16.00s/it] 65%|██████▌   | 2152/3309 [9:18:27<5:10:41, 16.11s/it] 65%|██████▌   | 2153/3309 [9:18:41<4:59:09, 15.53s/it] 65%|██████▌   | 2154/3309 [9:18:58<5:05:08, 15.85s/it] 65%|██████▌   | 2155/3309 [9:19:12<4:55:35, 15.37s/it] 65%|██████▌   | 2156/3309 [9:19:28<5:00:59, 15.66s/it] 65%|██████▌   | 2157/3309 [9:19:45<5:05:05, 15.89s/it] 65%|██████▌   | 2158/3309 [9:19:59<4:54:51, 15.37s/it] 65%|██████▌   | 2159/3309 [9:20:13<4:47:58, 15.02s/it] 65%|██████▌   | 2160/3309 [9:20:30<4:55:34, 15.43s/it]                                                       {'loss': 2.642, 'grad_norm': 17.798234939575195, 'learning_rate': 2.8435058380959957e-06, 'epoch': 0.65}
+ 65%|██████▌   | 2160/3309 [9:20:30<4:55:34, 15.43s/it] 65%|██████▌   | 2161/3309 [9:20:44<4:51:06, 15.21s/it] 65%|██████▌   | 2162/3309 [9:20:59<4:46:56, 15.01s/it] 65%|██████▌   | 2163/3309 [9:21:13<4:42:01, 14.77s/it] 65%|██████▌   | 2164/3309 [9:21:29<4:50:46, 15.24s/it] 65%|██████▌   | 2165/3309 [9:21:44<4:44:33, 14.92s/it] 65%|██████▌   | 2166/3309 [9:21:58<4:40:20, 14.72s/it] 65%|██████▌   | 2167/3309 [9:22:14<4:48:44, 15.17s/it] 66%|██████▌   | 2168/3309 [9:22:31<4:56:55, 15.61s/it] 66%|██████▌   | 2169/3309 [9:22:47<5:01:13, 15.85s/it] 66%|██████▌   | 2170/3309 [9:23:04<5:05:26, 16.09s/it]                                                       {'loss': 4.1208, 'grad_norm': 18.133886337280273, 'learning_rate': 2.7994470060428835e-06, 'epoch': 0.66}
+ 66%|██████▌   | 2170/3309 [9:23:04<5:05:26, 16.09s/it] 66%|██████▌   | 2171/3309 [9:23:20<5:06:58, 16.18s/it] 66%|██████▌   | 2172/3309 [9:23:34<4:55:22, 15.59s/it] 66%|██████▌   | 2173/3309 [9:23:51<4:59:03, 15.80s/it] 66%|██████▌   | 2174/3309 [9:24:05<4:49:03, 15.28s/it] 66%|██████▌   | 2175/3309 [9:24:21<4:54:34, 15.59s/it] 66%|██████▌   | 2176/3309 [9:24:36<4:48:43, 15.29s/it] 66%|██████▌   | 2177/3309 [9:24:50<4:44:39, 15.09s/it] 66%|██████▌   | 2178/3309 [9:25:04<4:39:41, 14.84s/it] 66%|██████▌   | 2179/3309 [9:25:18<4:34:25, 14.57s/it] 66%|██████▌   | 2180/3309 [9:25:33<4:33:36, 14.54s/it]                                                       {'loss': 4.8817, 'grad_norm': 18.74016571044922, 'learning_rate': 2.7555990798631436e-06, 'epoch': 0.66}
+ 66%|██████▌   | 2180/3309 [9:25:33<4:33:36, 14.54s/it] 66%|██████▌   | 2181/3309 [9:25:49<4:43:07, 15.06s/it] 66%|██████▌   | 2182/3309 [9:26:05<4:50:14, 15.45s/it] 66%|██████▌   | 2183/3309 [9:26:20<4:44:44, 15.17s/it] 66%|██████▌   | 2184/3309 [9:26:36<4:50:55, 15.52s/it] 66%|██████▌   | 2185/3309 [9:26:55<5:08:50, 16.49s/it] 66%|██████▌   | 2186/3309 [9:27:12<5:09:21, 16.53s/it] 66%|██████▌   | 2187/3309 [9:27:28<5:07:21, 16.44s/it] 66%|██████▌   | 2188/3309 [9:27:42<4:54:14, 15.75s/it] 66%|██████▌   | 2189/3309 [9:27:58<4:56:46, 15.90s/it] 66%|██████▌   | 2190/3309 [9:28:15<5:00:49, 16.13s/it]                                                       {'loss': 3.3242, 'grad_norm': 15.885804176330566, 'learning_rate': 2.711966262039145e-06, 'epoch': 0.66}
+ 66%|██████▌   | 2190/3309 [9:28:15<5:00:49, 16.13s/it] 66%|██████▌   | 2191/3309 [9:28:29<4:48:05, 15.46s/it] 66%|██████▌   | 2192/3309 [9:28:44<4:46:11, 15.37s/it] 66%|██████▋   | 2193/3309 [9:28:58<4:40:38, 15.09s/it] 66%|██████▋   | 2194/3309 [9:29:15<4:47:21, 15.46s/it] 66%|██████▋   | 2195/3309 [9:29:31<4:51:41, 15.71s/it] 66%|██████▋   | 2196/3309 [9:29:46<4:45:15, 15.38s/it] 66%|██████▋   | 2197/3309 [9:30:02<4:50:34, 15.68s/it] 66%|██████▋   | 2198/3309 [9:30:16<4:42:00, 15.23s/it] 66%|██████▋   | 2199/3309 [9:30:33<4:47:54, 15.56s/it] 66%|██████▋   | 2200/3309 [9:30:49<4:53:32, 15.88s/it]                                                       {'loss': 4.3377, 'grad_norm': 24.100414276123047, 'learning_rate': 2.668552734436802e-06, 'epoch': 0.66}
+ 66%|██████▋   | 2200/3309 [9:30:49<4:53:32, 15.88s/it] 67%|██████▋   | 2201/3309 [9:31:04<4:45:37, 15.47s/it] 67%|██████▋   | 2202/3309 [9:31:20<4:50:09, 15.73s/it] 67%|██████▋   | 2203/3309 [9:31:36<4:53:05, 15.90s/it] 67%|██████▋   | 2204/3309 [9:31:53<4:55:14, 16.03s/it] 67%|██████▋   | 2205/3309 [9:32:07<4:46:56, 15.59s/it] 67%|██████▋   | 2206/3309 [9:32:22<4:41:11, 15.30s/it] 67%|██████▋   | 2207/3309 [9:32:36<4:35:06, 14.98s/it] 67%|██████▋   | 2208/3309 [9:32:50<4:29:11, 14.67s/it] 67%|██████▋   | 2209/3309 [9:33:05<4:28:34, 14.65s/it] 67%|██████▋   | 2210/3309 [9:33:21<4:37:40, 15.16s/it]                                                       {'loss': 5.7855, 'grad_norm': 17.113306045532227, 'learning_rate': 2.6253626579047653e-06, 'epoch': 0.67}
+ 67%|██████▋   | 2210/3309 [9:33:21<4:37:40, 15.16s/it] 67%|██████▋   | 2211/3309 [9:33:35<4:32:33, 14.89s/it] 67%|██████▋   | 2212/3309 [9:33:52<4:42:04, 15.43s/it] 67%|██████▋   | 2213/3309 [9:34:06<4:35:09, 15.06s/it] 67%|██████▋   | 2214/3309 [9:34:20<4:30:03, 14.80s/it] 67%|██████▋   | 2215/3309 [9:34:37<4:38:12, 15.26s/it] 67%|██████▋   | 2216/3309 [9:34:53<4:43:31, 15.56s/it] 67%|██████▋   | 2217/3309 [9:35:09<4:46:53, 15.76s/it] 67%|██████▋   | 2218/3309 [9:35:26<4:51:25, 16.03s/it] 67%|██████▋   | 2219/3309 [9:35:40<4:41:44, 15.51s/it] 67%|██████▋   | 2220/3309 [9:35:55<4:36:51, 15.25s/it]                                                       {'loss': 3.4326, 'grad_norm': 33.268699645996094, 'learning_rate': 2.582400171875638e-06, 'epoch': 0.67}
+ 67%|██████▋   | 2220/3309 [9:35:55<4:36:51, 15.25s/it] 67%|██████▋   | 2221/3309 [9:36:11<4:42:17, 15.57s/it] 67%|██████▋   | 2222/3309 [9:36:25<4:34:57, 15.18s/it] 67%|██████▋   | 2223/3309 [9:36:40<4:29:32, 14.89s/it] 67%|██████▋   | 2224/3309 [9:36:56<4:38:34, 15.41s/it] 67%|██████▋   | 2225/3309 [9:37:11<4:33:20, 15.13s/it] 67%|██████▋   | 2226/3309 [9:37:27<4:39:41, 15.50s/it] 67%|██████▋   | 2227/3309 [9:37:44<4:45:33, 15.84s/it] 67%|██████▋   | 2228/3309 [9:37:58<4:38:07, 15.44s/it] 67%|██████▋   | 2229/3309 [9:38:12<4:31:45, 15.10s/it] 67%|██████▋   | 2230/3309 [9:38:27<4:28:57, 14.96s/it]                                                       {'loss': 4.8596, 'grad_norm': 29.673768997192383, 'learning_rate': 2.5396693939692474e-06, 'epoch': 0.67}
+ 67%|██████▋   | 2230/3309 [9:38:27<4:28:57, 14.96s/it] 67%|██████▋   | 2231/3309 [9:38:43<4:35:46, 15.35s/it] 67%|██████▋   | 2232/3309 [9:38:58<4:31:39, 15.13s/it] 67%|██████▋   | 2233/3309 [9:39:14<4:37:23, 15.47s/it] 68%|██████▊   | 2234/3309 [9:39:28<4:28:28, 14.98s/it] 68%|██████▊   | 2235/3309 [9:39:44<4:34:56, 15.36s/it] 68%|██████▊   | 2236/3309 [9:39:59<4:28:41, 15.02s/it] 68%|██████▊   | 2237/3309 [9:40:15<4:35:41, 15.43s/it] 68%|██████▊   | 2238/3309 [9:40:29<4:29:51, 15.12s/it] 68%|██████▊   | 2239/3309 [9:40:47<4:41:18, 15.77s/it] 68%|██████▊   | 2240/3309 [9:41:05<4:52:32, 16.42s/it]                                                       {'loss': 5.1031, 'grad_norm': 14.550185203552246, 'learning_rate': 2.4971744195979985e-06, 'epoch': 0.68}
+ 68%|██████▊   | 2240/3309 [9:41:05<4:52:32, 16.42s/it] 68%|██████▊   | 2241/3309 [9:41:21<4:51:33, 16.38s/it] 68%|██████▊   | 2242/3309 [9:41:37<4:50:40, 16.35s/it] 68%|██████▊   | 2243/3309 [9:41:51<4:39:29, 15.73s/it] 68%|██████▊   | 2244/3309 [9:42:11<5:01:15, 16.97s/it] 68%|██████▊   | 2245/3309 [9:42:28<4:58:48, 16.85s/it] 68%|██████▊   | 2246/3309 [9:42:44<4:55:21, 16.67s/it] 68%|██████▊   | 2247/3309 [9:42:59<4:43:39, 16.03s/it] 68%|██████▊   | 2248/3309 [9:43:13<4:36:04, 15.61s/it] 68%|██████▊   | 2249/3309 [9:43:28<4:30:52, 15.33s/it] 68%|██████▊   | 2250/3309 [9:43:43<4:27:13, 15.14s/it]                                                       {'loss': 5.833, 'grad_norm': 32.16508102416992, 'learning_rate': 2.4549193215743706e-06, 'epoch': 0.68}
+ 68%|██████▊   | 2250/3309 [9:43:43<4:27:13, 15.14s/it] 68%|██████▊   | 2251/3309 [9:43:57<4:24:12, 14.98s/it] 68%|██████▊   | 2252/3309 [9:44:13<4:30:25, 15.35s/it] 68%|██████▊   | 2253/3309 [9:44:30<4:35:26, 15.65s/it] 68%|██████▊   | 2254/3309 [9:44:47<4:40:55, 15.98s/it] 68%|██████▊   | 2255/3309 [9:45:03<4:44:08, 16.17s/it] 68%|██████▊   | 2256/3309 [9:45:20<4:46:11, 16.31s/it] 68%|██████▊   | 2257/3309 [9:45:36<4:47:47, 16.41s/it] 68%|██████▊   | 2258/3309 [9:45:51<4:36:19, 15.77s/it] 68%|██████▊   | 2259/3309 [9:46:07<4:39:18, 15.96s/it] 68%|██████▊   | 2260/3309 [9:46:24<4:44:21, 16.26s/it]                                                       {'loss': 3.3544, 'grad_norm': 18.873088836669922, 'learning_rate': 2.4129081497205536e-06, 'epoch': 0.68}
+ 68%|██████▊   | 2260/3309 [9:46:24<4:44:21, 16.26s/it] 68%|██████▊   | 2261/3309 [9:46:39<4:34:06, 15.69s/it] 68%|██████▊   | 2262/3309 [9:46:53<4:27:41, 15.34s/it] 68%|██████▊   | 2263/3309 [9:47:08<4:25:07, 15.21s/it] 68%|██████▊   | 2264/3309 [9:47:24<4:30:43, 15.54s/it] 68%|██████▊   | 2265/3309 [9:47:38<4:23:25, 15.14s/it] 68%|██████▊   | 2266/3309 [9:47:55<4:29:22, 15.50s/it] 69%|██████▊   | 2267/3309 [9:48:11<4:33:19, 15.74s/it] 69%|██████▊   | 2268/3309 [9:48:27<4:36:04, 15.91s/it] 69%|██████▊   | 2269/3309 [9:48:44<4:38:22, 16.06s/it] 69%|██████▊   | 2270/3309 [9:49:00<4:40:58, 16.23s/it]                                                       {'loss': 4.0864, 'grad_norm': 31.875137329101562, 'learning_rate': 2.3711449304803174e-06, 'epoch': 0.69}
+ 69%|██████▊   | 2270/3309 [9:49:00<4:40:58, 16.23s/it] 69%|██████▊   | 2271/3309 [9:49:22<5:08:40, 17.84s/it] 69%|██████▊   | 2272/3309 [9:49:44<5:29:18, 19.05s/it] 69%|██████▊   | 2273/3309 [9:50:06<5:45:08, 19.99s/it] 69%|██████▊   | 2274/3309 [9:50:23<5:27:04, 18.96s/it] 69%|██████▉   | 2275/3309 [9:50:41<5:25:44, 18.90s/it] 69%|██████▉   | 2276/3309 [9:51:00<5:24:46, 18.86s/it] 69%|██████▉   | 2277/3309 [9:51:18<5:21:28, 18.69s/it] 69%|██████▉   | 2278/3309 [9:51:37<5:18:07, 18.51s/it] 69%|██████▉   | 2279/3309 [9:52:04<6:05:22, 21.28s/it] 69%|██████▉   | 2280/3309 [9:52:30<6:25:16, 22.46s/it]                                                       {'loss': 4.0582, 'grad_norm': 27.996572494506836, 'learning_rate': 2.329633666533103e-06, 'epoch': 0.69}
+ 69%|██████▉   | 2280/3309 [9:52:30<6:25:16, 22.46s/it] 69%|██████▉   | 2281/3309 [9:52:53<6:30:13, 22.78s/it] 69%|██████▉   | 2282/3309 [9:53:17<6:33:37, 23.00s/it] 69%|██████▉   | 2283/3309 [9:53:35<6:11:15, 21.71s/it] 69%|██████▉   | 2284/3309 [9:53:54<5:54:59, 20.78s/it] 69%|██████▉   | 2285/3309 [9:54:13<5:46:36, 20.31s/it] 69%|██████▉   | 2286/3309 [9:54:35<5:53:16, 20.72s/it] 69%|██████▉   | 2287/3309 [9:54:53<5:41:03, 20.02s/it] 69%|██████▉   | 2288/3309 [9:55:15<5:49:05, 20.51s/it] 69%|██████▉   | 2289/3309 [9:55:32<5:31:22, 19.49s/it] 69%|██████▉   | 2290/3309 [9:55:55<5:47:53, 20.48s/it]                                                       {'loss': 4.2188, 'grad_norm': 19.299062728881836, 'learning_rate': 2.288378336410398e-06, 'epoch': 0.69}
+ 69%|██████▉   | 2290/3309 [9:55:55<5:47:53, 20.48s/it] 69%|██████▉   | 2291/3309 [9:56:14<5:42:15, 20.17s/it] 69%|██████▉   | 2292/3309 [9:56:35<5:43:22, 20.26s/it] 69%|██████▉   | 2293/3309 [9:56:56<5:46:22, 20.45s/it] 69%|██████▉   | 2294/3309 [9:57:16<5:45:39, 20.43s/it] 69%|██████▉   | 2295/3309 [9:57:34<5:35:41, 19.86s/it] 69%|██████▉   | 2296/3309 [9:57:53<5:27:08, 19.38s/it] 69%|██████▉   | 2297/3309 [9:58:11<5:23:11, 19.16s/it] 69%|██████▉   | 2298/3309 [9:58:33<5:35:13, 19.89s/it] 69%|██████▉   | 2299/3309 [9:58:51<5:26:43, 19.41s/it] 70%|██████▉   | 2300/3309 [9:59:13<5:37:40, 20.08s/it]                                                       {'loss': 4.8756, 'grad_norm': 21.146148681640625, 'learning_rate': 2.2473828941144277e-06, 'epoch': 0.7}
+ 70%|██████▉   | 2300/3309 [9:59:13<5:37:40, 20.08s/it] 70%|██████▉   | 2301/3309 [9:59:35<5:47:06, 20.66s/it] 70%|██████▉   | 2302/3309 [9:59:53<5:36:06, 20.03s/it] 70%|██████▉   | 2303/3309 [10:00:14<5:38:17, 20.18s/it] 70%|██████▉   | 2304/3309 [10:00:35<5:41:06, 20.36s/it] 70%|██████▉   | 2305/3309 [10:00:53<5:30:22, 19.74s/it] 70%|██████▉   | 2306/3309 [10:01:12<5:24:32, 19.41s/it] 70%|██████▉   | 2307/3309 [10:01:33<5:35:40, 20.10s/it] 70%|██████▉   | 2308/3309 [10:01:56<5:48:35, 20.89s/it] 70%|██████▉   | 2309/3309 [10:02:17<5:46:33, 20.79s/it] 70%|██████▉   | 2310/3309 [10:02:38<5:46:53, 20.83s/it]                                                        {'loss': 3.3593, 'grad_norm': 28.3226261138916, 'learning_rate': 2.20665126873919e-06, 'epoch': 0.7}
+ 70%|██████▉   | 2310/3309 [10:02:38<5:46:53, 20.83s/it] 70%|██████▉   | 2311/3309 [10:02:56<5:32:29, 19.99s/it] 70%|██████▉   | 2312/3309 [10:03:14<5:25:09, 19.57s/it] 70%|██████▉   | 2313/3309 [10:03:32<5:16:50, 19.09s/it] 70%|██████▉   | 2314/3309 [10:03:51<5:14:11, 18.95s/it] 70%|██████▉   | 2315/3309 [10:04:12<5:26:58, 19.74s/it] 70%|██████▉   | 2316/3309 [10:04:35<5:38:56, 20.48s/it] 70%|███████   | 2317/3309 [10:04:53<5:27:17, 19.80s/it] 70%|███████   | 2318/3309 [10:05:14<5:35:53, 20.34s/it] 70%|███████   | 2319/3309 [10:05:36<5:42:09, 20.74s/it] 70%|███████   | 2320/3309 [10:05:58<5:46:20, 21.01s/it]                                                        {'loss': 4.1255, 'grad_norm': 16.02470588684082, 'learning_rate': 2.1661873640938818e-06, 'epoch': 0.7}
+ 70%|███████   | 2320/3309 [10:05:58<5:46:20, 21.01s/it] 70%|███████   | 2321/3309 [10:06:16<5:34:09, 20.29s/it] 70%|███████   | 2322/3309 [10:06:35<5:23:23, 19.66s/it] 70%|███████   | 2323/3309 [10:06:56<5:32:37, 20.24s/it] 70%|███████   | 2324/3309 [10:07:14<5:21:20, 19.57s/it] 70%|███████   | 2325/3309 [10:07:35<5:26:38, 19.92s/it] 70%|███████   | 2326/3309 [10:07:53<5:18:28, 19.44s/it] 70%|███████   | 2327/3309 [10:08:12<5:14:56, 19.24s/it] 70%|█��█████   | 2328/3309 [10:08:34<5:26:24, 19.96s/it] 70%|███████   | 2329/3309 [10:08:55<5:35:20, 20.53s/it] 70%|███████   | 2330/3309 [10:09:15<5:28:18, 20.12s/it]                                                        {'loss': 4.145, 'grad_norm': 21.263837814331055, 'learning_rate': 2.1259950583287633e-06, 'epoch': 0.7}
+ 70%|███████   | 2330/3309 [10:09:15<5:28:18, 20.12s/it] 70%|███████   | 2331/3309 [10:09:36<5:36:08, 20.62s/it] 70%|███████   | 2332/3309 [10:09:54<5:20:16, 19.67s/it] 71%|███████   | 2333/3309 [10:10:08<4:53:28, 18.04s/it] 71%|███████   | 2334/3309 [10:10:25<4:46:20, 17.62s/it] 71%|███████   | 2335/3309 [10:10:39<4:31:26, 16.72s/it] 71%|███████   | 2336/3309 [10:10:54<4:21:25, 16.12s/it] 71%|███████   | 2337/3309 [10:11:08<4:12:30, 15.59s/it] 71%|███████   | 2338/3309 [10:11:23<4:05:30, 15.17s/it] 71%|███████   | 2339/3309 [10:11:39<4:11:11, 15.54s/it] 71%|███████   | 2340/3309 [10:11:58<4:26:02, 16.47s/it]                                                        {'loss': 4.7453, 'grad_norm': 22.879661560058594, 'learning_rate': 2.086078203563439e-06, 'epoch': 0.71}
+ 71%|███████   | 2340/3309 [10:11:58<4:26:02, 16.47s/it] 71%|███████   | 2341/3309 [10:12:14<4:24:58, 16.42s/it] 71%|███████   | 2342/3309 [10:12:30<4:24:05, 16.39s/it] 71%|███████   | 2343/3309 [10:12:45<4:15:32, 15.87s/it] 71%|███████   | 2344/3309 [10:13:01<4:16:58, 15.98s/it] 71%|███████   | 2345/3309 [10:13:16<4:09:10, 15.51s/it] 71%|███████   | 2346/3309 [10:13:32<4:12:48, 15.75s/it] 71%|███████   | 2347/3309 [10:13:48<4:15:11, 15.92s/it] 71%|███████   | 2348/3309 [10:14:05<4:18:06, 16.12s/it] 71%|███████   | 2349/3309 [10:14:19<4:08:37, 15.54s/it] 71%|███████   | 2350/3309 [10:14:35<4:12:08, 15.77s/it]                                                        {'loss': 4.019, 'grad_norm': 15.726652145385742, 'learning_rate': 2.0464406255176967e-06, 'epoch': 0.71}
+ 71%|███████   | 2350/3309 [10:14:35<4:12:08, 15.77s/it] 71%|███████   | 2351/3309 [10:14:50<4:04:27, 15.31s/it] 71%|███████   | 2352/3309 [10:15:06<4:09:00, 15.61s/it] 71%|███████   | 2353/3309 [10:15:20<4:00:54, 15.12s/it] 71%|███████   | 2354/3309 [10:15:36<4:06:31, 15.49s/it] 71%|███████   | 2355/3309 [10:15:58<4:35:48, 17.35s/it] 71%|███████   | 2356/3309 [10:16:16<4:37:49, 17.49s/it] 71%|███████   | 2357/3309 [10:16:34<4:42:32, 17.81s/it] 71%|███████▏  | 2358/3309 [10:16:54<4:53:42, 18.53s/it] 71%|███████▏  | 2359/3309 [10:17:15<5:03:41, 19.18s/it] 71%|███████▏  | 2360/3309 [10:17:33<4:56:56, 18.77s/it]                                                        {'loss': 4.9014, 'grad_norm': 30.606904983520508, 'learning_rate': 2.0070861231448142e-06, 'epoch': 0.71}
+ 71%|███████▏  | 2360/3309 [10:17:33<4:56:56, 18.77s/it] 71%|███████▏  | 2361/3309 [10:17:51<4:55:08, 18.68s/it] 71%|███████▏  | 2362/3309 [10:18:10<4:54:38, 18.67s/it] 71%|███████▏  | 2363/3309 [10:18:29<4:53:21, 18.61s/it] 71%|███████▏  | 2364/3309 [10:18:49<5:00:43, 19.09s/it] 71%|███████▏  | 2365/3309 [10:19:10<5:12:33, 19.87s/it] 72%|███████▏  | 2366/3309 [10:19:32<5:20:50, 20.41s/it] 72%|███████▏  | 2367/3309 [10:19:52<5:19:42, 20.36s/it] 72%|███████▏  | 2368/3309 [10:20:10<5:08:41, 19.68s/it] 72%|███████▏  | 2369/3309 [10:20:28<4:57:13, 18.97s/it] 72%|███████▏  | 2370/3309 [10:20:46<4:54:49, 18.84s/it]                                                        {'loss': 4.1918, 'grad_norm': 17.185054779052734, 'learning_rate': 1.968018468267472e-06, 'epoch': 0.72}
+ 72%|███████▏  | 2370/3309 [10:20:46<4:54:49, 18.84s/it] 72%|███████▏  | 2371/3309 [10:21:04<4:50:42, 18.60s/it] 72%|███████▏  | 2372/3309 [10:21:23<4:49:31, 18.54s/it] 72%|███████▏  | 2373/3309 [10:21:41<4:49:30, 18.56s/it] 72%|███████▏  | 2374/3309 [10:21:59<4:46:55, 18.41s/it] 72%|███████▏  | 2375/3309 [10:22:21<5:01:27, 19.37s/it] 72%|███████▏  | 2376/3309 [10:22:43<5:12:26, 20.09s/it] 72%|███████▏  | 2377/3309 [10:23:04<5:15:35, 20.32s/it] 72%|███████▏  | 2378/3309 [10:23:22<5:06:40, 19.76s/it] 72%|███████▏  | 2379/3309 [10:23:44<5:15:25, 20.35s/it] 72%|███████▏  | 2380/3309 [10:24:06<5:22:25, 20.82s/it]                                                        {'loss': 4.0934, 'grad_norm': 15.510167121887207, 'learning_rate': 1.929241405216254e-06, 'epoch': 0.72}
+ 72%|███████▏  | 2380/3309 [10:24:06<5:22:25, 20.82s/it] 72%|███████▏  | 2381/3309 [10:24:28<5:27:54, 21.20s/it] 72%|███████▏  | 2382/3309 [10:24:50<5:30:02, 21.36s/it] 72%|███████▏  | 2383/3309 [10:25:07<5:12:13, 20.23s/it] 72%|███████▏  | 2384/3309 [10:25:26<5:04:09, 19.73s/it] 72%|███████▏  | 2385/3309 [10:25:44<4:55:00, 19.16s/it] 72%|███████▏  | 2386/3309 [10:26:03<4:54:30, 19.14s/it] 72%|███████▏  | 2387/3309 [10:26:22<4:56:30, 19.30s/it] 72%|███████▏  | 2388/3309 [10:26:37<4:34:09, 17.86s/it] 72%|███████▏  | 2389/3309 [10:26:53<4:26:35, 17.39s/it] 72%|███████▏  | 2390/3309 [10:27:07<4:10:03, 16.33s/it]                                                        {'loss': 4.701, 'grad_norm': 20.12055206298828, 'learning_rate': 1.8907586504707776e-06, 'epoch': 0.72}
+ 72%|███████▏  | 2390/3309 [10:27:07<4:10:03, 16.33s/it] 72%|███████▏  | 2391/3309 [10:27:24<4:10:55, 16.40s/it] 72%|███████▏  | 2392/3309 [10:27:40<4:11:29, 16.45s/it] 72%|███████▏  | 2393/3309 [10:27:56<4:10:27, 16.41s/it] 72%|███████▏  | 2394/3309 [10:28:13<4:09:43, 16.37s/it] 72%|███████▏  | 2395/3309 [10:28:27<3:59:26, 15.72s/it] 72%|███████▏  | 2396/3309 [10:28:42<3:55:35, 15.48s/it] 72%|███████▏  | 2397/3309 [10:28:56<3:49:25, 15.09s/it] 72%|███████▏  | 2398/3309 [10:29:10<3:45:19, 14.84s/it] 72%|███████▏  | 2399/3309 [10:29:27<3:53:19, 15.38s/it] 73%|███████▎  | 2400/3309 [10:29:41<3:47:55, 15.04s/it]                                                        {'loss': 2.5439, 'grad_norm': 19.135282516479492, 'learning_rate': 1.8525738923035002e-06, 'epoch': 0.73}
+ 73%|███████▎  | 2400/3309 [10:29:41<3:47:55, 15.04s/it] 73%|███████▎  | 2401/3309 [10:29:55<3:44:00, 14.80s/it] 73%|███████▎  | 2402/3309 [10:30:10<3:42:43, 14.73s/it] 73%|███████▎  | 2403/3309 [10:30:27<3:50:53, 15.29s/it] 73%|███████▎  | 2404/3309 [10:30:43<3:55:25, 15.61s/it] 73%|███████▎  | 2405/3309 [10:30:57<3:50:18, 15.29s/it] 73%|███████▎  | 2406/3309 [10:31:12<3:45:00, 14.95s/it] 73%|███████▎  | 2407/3309 [10:31:26<3:40:23, 14.66s/it] 73%|███████▎  | 2408/3309 [10:31:42<3:48:50, 15.24s/it] 73%|███████▎  | 2409/3309 [10:31:59<3:53:39, 15.58s/it] 73%|███████▎  | 2410/3309 [10:32:15<3:58:06, 15.89s/it]                                                        {'loss': 4.2791, 'grad_norm': 19.167003631591797, 'learning_rate': 1.8146907904262268e-06, 'epoch': 0.73}
+ 73%|███████▎  | 2410/3309 [10:32:15<3:58:06, 15.89s/it] 73%|███████▎  | 2411/3309 [10:32:30<3:52:20, 15.52s/it] 73%|███████▎  | 2412/3309 [10:32:44<3:46:02, 15.12s/it] 73%|███████▎  | 2413/3309 [10:33:00<3:50:48, 15.46s/it] 73%|███████▎  | 2414/3309 [10:33:17<3:54:19, 15.71s/it] 73%|███████▎  | 2415/3309 [10:33:33<3:57:57, 15.97s/it] 73%|███████▎  | 2416/3309 [10:33:49<3:59:17, 16.08s/it] 73%|███████▎  | 2417/3309 [10:34:06<4:01:09, 16.22s/it] 73%|███████▎  | 2418/3309 [10:34:23<4:02:53, 16.36s/it] 73%|███████▎  | 2419/3309 [10:34:37<3:53:08, 15.72s/it] 73%|███████▎  | 2420/3309 [10:34:53<3:55:53, 15.92s/it]                                                        {'loss': 3.4256, 'grad_norm': 24.79986572265625, 'learning_rate': 1.7771129756393545e-06, 'epoch': 0.73}
+ 73%|███████▎  | 2420/3309 [10:34:53<3:55:53, 15.92s/it] 73%|███████▎  | 2421/3309 [10:35:08<3:48:09, 15.42s/it] 73%|███████▎  | 2422/3309 [10:35:24<3:51:55, 15.69s/it] 73%|███████▎  | 2423/3309 [10:35:38<3:45:18, 15.26s/it] 73%|███████▎  | 2424/3309 [10:35:55<3:50:37, 15.64s/it] 73%|███████▎  | 2425/3309 [10:36:09<3:46:11, 15.35s/it] 73%|███████▎  | 2426/3309 [10:36:27<3:57:04, 16.11s/it] 73%|███████▎  | 2427/3309 [10:36:45<4:02:43, 16.51s/it] 73%|███████▎  | 2428/3309 [10:37:01<4:03:11, 16.56s/it] 73%|███████▎  | 2429/3309 [10:37:16<3:52:35, 15.86s/it] 73%|███████▎  | 2430/3309 [10:37:32<3:54:21, 16.00s/it]                                                        {'loss': 3.5206, 'grad_norm': 20.59393310546875, 'learning_rate': 1.7398440494838947e-06, 'epoch': 0.73}
+ 73%|███████▎  | 2430/3309 [10:37:32<3:54:21, 16.00s/it] 73%|███████▎  | 2431/3309 [10:37:48<3:55:32, 16.10s/it] 73%|███████▎  | 2432/3309 [10:38:05<3:56:27, 16.18s/it] 74%|███████▎  | 2433/3309 [10:38:19<3:49:10, 15.70s/it] 74%|███████▎  | 2434/3309 [10:38:38<4:01:58, 16.59s/it] 74%|███████▎  | 2435/3309 [10:38:52<3:51:20, 15.88s/it] 74%|███████▎  | 2436/3309 [10:39:06<3:43:44, 15.38s/it] 74%|███████▎  | 2437/3309 [10:39:21<3:39:28, 15.10s/it] 74%|███████▎  | 2438/3309 [10:39:35<3:37:06, 14.96s/it] 74%|███████▎  | 2439/3309 [10:39:49<3:32:25, 14.65s/it] 74%|███████▎  | 2440/3309 [10:40:03<3:30:06, 14.51s/it]                                                        {'loss': 4.1281, 'grad_norm': 25.903627395629883, 'learning_rate': 1.7028875838962822e-06, 'epoch': 0.74}
+ 74%|███████▎  | 2440/3309 [10:40:03<3:30:06, 14.51s/it] 74%|███████▍  | 2441/3309 [10:40:20<3:38:40, 15.12s/it] 74%|███████▍  | 2442/3309 [10:40:36<3:43:47, 15.49s/it] 74%|███████▍  | 2443/3309 [10:40:53<3:46:41, 15.71s/it] 74%|███████▍  | 2444/3309 [10:41:07<3:42:05, 15.40s/it] 74%|███████▍  | 2445/3309 [10:41:24<3:45:40, 15.67s/it] 74%|███████▍  | 2446/3309 [10:41:38<3:39:15, 15.24s/it] 74%|███████▍  | 2447/3309 [10:41:54<3:45:08, 15.67s/it] 74%|███████▍  | 2448/3309 [10:42:08<3:37:38, 15.17s/it] 74%|███████▍  | 2449/3309 [10:42:25<3:43:19, 15.58s/it] 74%|███████▍  | 2450/3309 [10:42:40<3:39:11, 15.31s/it]                                                        {'loss': 4.0468, 'grad_norm': 35.45489501953125, 'learning_rate': 1.6662471208660392e-06, 'epoch': 0.74}
+ 74%|███████▍  | 2450/3309 [10:42:40<3:39:11, 15.31s/it] 74%|███████▍  | 2451/3309 [10:42:54<3:34:08, 14.98s/it] 74%|███████▍  | 2452/3309 [10:43:09<3:32:17, 14.86s/it] 74%|███████▍  | 2453/3309 [10:43:23<3:31:21, 14.81s/it] 74%|███████▍  | 2454/3309 [10:43:40<3:38:31, 15.33s/it] 74%|███████▍  | 2455/3309 [10:43:54<3:33:36, 15.01s/it] 74%|███████▍  | 2456/3309 [10:44:11<3:40:18, 15.50s/it] 74%|███████▍  | 2457/3309 [10:44:27<3:44:34, 15.82s/it] 74%|███████▍  | 2458/3309 [10:44:44<3:46:44, 15.99s/it] 74%|███████▍  | 2459/3309 [10:44:58<3:38:07, 15.40s/it] 74%|███████▍  | 2460/3309 [10:45:17<3:56:16, 16.70s/it]                                                        {'loss': 4.1749, 'grad_norm': 20.3117618560791, 'learning_rate': 1.6299261720963095e-06, 'epoch': 0.74}
+ 74%|███████▍  | 2460/3309 [10:45:17<3:56:16, 16.70s/it] 74%|███████▍  | 2461/3309 [10:45:34<3:54:33, 16.60s/it] 74%|███████▍  | 2462/3309 [10:45:48<3:44:03, 15.87s/it] 74%|███████▍  | 2463/3309 [10:46:03<3:38:39, 15.51s/it] 74%|███████▍  | 2464/3309 [10:46:17<3:34:02, 15.20s/it] 74%|███████▍  | 2465/3309 [10:46:31<3:28:28, 14.82s/it] 75%|███████▍  | 2466/3309 [10:46:46<3:27:27, 14.77s/it] 75%|███████▍  | 2467/3309 [10:47:02<3:35:01, 15.32s/it] 75%|███████▍  | 2468/3309 [10:47:17<3:32:07, 15.13s/it] 75%|███████▍  | 2469/3309 [10:47:33<3:37:00, 15.50s/it] 75%|███████▍  | 2470/3309 [10:47:47<3:30:14, 15.04s/it]                                                        {'loss': 4.8916, 'grad_norm': 15.878867149353027, 'learning_rate': 1.5939282186672705e-06, 'epoch': 0.75}
+ 75%|███████▍  | 2470/3309 [10:47:47<3:30:14, 15.04s/it] 75%|███████▍  | 2471/3309 [10:48:01<3:26:38, 14.79s/it] 75%|███████▍  | 2472/3309 [10:48:18<3:32:24, 15.23s/it] 75%|███████▍  | 2473/3309 [10:48:34<3:38:03, 15.65s/it] 75%|███████▍  | 2474/3309 [10:48:49<3:31:49, 15.22s/it] 75%|███████▍  | 2475/3309 [10:49:03<3:28:28, 15.00s/it] 75%|███████▍  | 2476/3309 [10:49:18<3:26:16, 14.86s/it] 75%|███████▍  | 2477/3309 [10:49:34<3:32:10, 15.30s/it] 75%|███████▍  | 2478/3309 [10:49:49<3:29:05, 15.10s/it] 75%|███████▍  | 2479/3309 [10:50:03<3:25:16, 14.84s/it] 75%|███████▍  | 2480/3309 [10:50:18<3:26:30, 14.95s/it]                                                        {'loss': 4.8288, 'grad_norm': 19.15277099609375, 'learning_rate': 1.5582567107025237e-06, 'epoch': 0.75}
+ 75%|███████▍  | 2480/3309 [10:50:18<3:26:30, 14.95s/it] 75%|███████▍  | 2481/3309 [10:50:32<3:22:58, 14.71s/it] 75%|███████▌  | 2482/3309 [10:50:47<3:22:23, 14.68s/it] 75%|███████▌  | 2483/3309 [10:51:03<3:28:45, 15.16s/it] 75%|███████▌  | 2484/3309 [10:51:17<3:24:35, 14.88s/it] 75%|███████▌  | 2485/3309 [10:51:34<3:30:40, 15.34s/it] 75%|███████▌  | 2486/3309 [10:51:48<3:25:48, 15.00s/it] 75%|███████▌  | 2487/3309 [10:52:07<3:40:41, 16.11s/it] 75%|███████▌  | 2488/3309 [10:52:23<3:41:40, 16.20s/it] 75%|███████▌  | 2489/3309 [10:52:40<3:44:05, 16.40s/it] 75%|███████▌  | 2490/3309 [10:52:58<3:51:44, 16.98s/it]                                                        {'loss': 3.3806, 'grad_norm': 29.44374656677246, 'learning_rate': 1.5229150670384057e-06, 'epoch': 0.75}
+ 75%|███████▌  | 2490/3309 [10:52:58<3:51:44, 16.98s/it] 75%|███████▌  | 2491/3309 [10:53:15<3:49:13, 16.81s/it] 75%|███████▌  | 2492/3309 [10:53:31<3:47:10, 16.68s/it] 75%|███████▌  | 2493/3309 [10:53:47<3:46:19, 16.64s/it] 75%|███████▌  | 2494/3309 [10:54:04<3:46:18, 16.66s/it] 75%|███████▌  | 2495/3309 [10:54:23<3:53:39, 17.22s/it] 75%|███████▌  | 2496/3309 [10:54:41<3:57:13, 17.51s/it] 75%|███████▌  | 2497/3309 [10:55:03<4:13:58, 18.77s/it] 75%|███████▌  | 2498/3309 [10:55:20<4:08:43, 18.40s/it] 76%|███████▌  | 2499/3309 [10:55:36<3:59:55, 17.77s/it] 76%|███████▌  | 2500/3309 [10:55:53<3:53:30, 17.32s/it]                                                        {'loss': 2.5563, 'grad_norm': 23.206140518188477, 'learning_rate': 1.4879066748963295e-06, 'epoch': 0.76}
+ 76%|███████▌  | 2500/3309 [10:55:53<3:53:30, 17.32s/it] 76%|███████▌  | 2501/3309 [10:56:09<3:49:16, 17.02s/it] 76%|███████▌  | 2502/3309 [10:56:23<3:37:47, 16.19s/it] 76%|███████▌  | 2503/3309 [10:56:40<3:37:35, 16.20s/it] 76%|███████▌  | 2504/3309 [10:56:56<3:38:34, 16.29s/it] 76%|███████▌  | 2505/3309 [10:57:11<3:31:54, 15.81s/it] 76%|███████▌  | 2506/3309 [10:57:27<3:34:39, 16.04s/it] 76%|███████▌  | 2507/3309 [10:57:44<3:35:32, 16.13s/it] 76%|███████▌  | 2508/3309 [10:58:00<3:37:37, 16.30s/it] 76%|███████▌  | 2509/3309 [10:58:15<3:31:56, 15.90s/it] 76%|███████▌  | 2510/3309 [10:58:42<4:15:29, 19.19s/it]                                                        {'loss': 3.4434, 'grad_norm': 27.133193969726562, 'learning_rate': 1.4532348895581466e-06, 'epoch': 0.76}
+ 76%|███████▌  | 2510/3309 [10:58:42<4:15:29, 19.19s/it] 76%|███████▌  | 2511/3309 [10:58:57<3:56:46, 17.80s/it] 76%|███████▌  | 2512/3309 [10:59:13<3:50:44, 17.37s/it] 76%|███████▌  | 2513/3309 [10:59:29<3:46:13, 17.05s/it] 76%|███████▌  | 2514/3309 [10:59:45<3:38:33, 16.50s/it] 76%|███████▌  | 2515/3309 [10:59:59<3:29:15, 15.81s/it] 76%|███████▌  | 2516/3309 [11:00:13<3:22:26, 15.32s/it] 76%|███████▌  | 2517/3309 [11:00:28<3:19:30, 15.11s/it] 76%|███████▌  | 2518/3309 [11:00:42<3:17:27, 14.98s/it] 76%|███████▌  | 2519/3309 [11:00:59<3:23:41, 15.47s/it] 76%|███████▌  | 2520/3309 [11:01:13<3:19:46, 15.19s/it]                                                        {'loss': 6.7087, 'grad_norm': 29.599319458007812, 'learning_rate': 1.4189030340445648e-06, 'epoch': 0.76}
+ 76%|███████▌  | 2520/3309 [11:01:13<3:19:46, 15.19s/it] 76%|███████▌  | 2521/3309 [11:01:28<3:15:35, 14.89s/it] 76%|███████▌  | 2522/3309 [11:01:42<3:14:24, 14.82s/it] 76%|███████▌  | 2523/3309 [11:01:59<3:21:08, 15.35s/it] 76%|███████▋  | 2524/3309 [11:02:16<3:26:12, 15.76s/it] 76%|███████▋  | 2525/3309 [11:02:32<3:29:14, 16.01s/it] 76%|███████▋  | 2526/3309 [11:02:47<3:23:55, 15.63s/it] 76%|███████▋  | 2527/3309 [11:03:01<3:18:14, 15.21s/it] 76%|███████▋  | 2528/3309 [11:03:18<3:23:41, 15.65s/it] 76%|███████▋  | 2529/3309 [11:03:32<3:19:35, 15.35s/it] 76%|███████▋  | 2530/3309 [11:03:49<3:23:36, 15.68s/it]                                                        {'loss': 4.9595, 'grad_norm': 17.123348236083984, 'learning_rate': 1.3849143987966646e-06, 'epoch': 0.76}
+ 76%|███████▋  | 2530/3309 [11:03:49<3:23:36, 15.68s/it] 76%|███████▋  | 2531/3309 [11:04:05<3:25:38, 15.86s/it] 77%|███████▋  | 2532/3309 [11:04:22<3:27:59, 16.06s/it] 77%|███████▋  | 2533/3309 [11:04:41<3:39:14, 16.95s/it] 77%|███████▋  | 2534/3309 [11:05:06<4:11:23, 19.46s/it] 77%|███████▋  | 2535/3309 [11:05:20<3:50:53, 17.90s/it] 77%|███████▋  | 2536/3309 [11:05:37<3:44:40, 17.44s/it] 77%|███████▋  | 2537/3309 [11:05:53<3:41:18, 17.20s/it] 77%|███████▋  | 2538/3309 [11:06:08<3:31:00, 16.42s/it] 77%|███████▋  | 2539/3309 [11:06:24<3:30:20, 16.39s/it] 77%|███████▋  | 2540/3309 [11:06:40<3:28:58, 16.31s/it]                                                        {'loss': 4.0857, 'grad_norm': 16.49233627319336, 'learning_rate': 1.3512722413605356e-06, 'epoch': 0.77}
+ 77%|███████▋  | 2540/3309 [11:06:40<3:28:58, 16.31s/it] 77%|███████▋  | 2541/3309 [11:06:54<3:19:26, 15.58s/it] 77%|███████▋  | 2542/3309 [11:07:11<3:23:29, 15.92s/it] 77%|███████▋  | 2543/3309 [11:07:26<3:18:07, 15.52s/it] 77%|███████▋  | 2544/3309 [11:07:40<3:13:14, 15.16s/it] 77%|███████▋  | 2545/3309 [11:07:56<3:17:14, 15.49s/it] 77%|███████▋  | 2546/3309 [11:08:11<3:13:45, 15.24s/it] 77%|███████▋  | 2547/3309 [11:08:27<3:17:48, 15.58s/it] 77%|███████▋  | 2548/3309 [11:08:44<3:21:48, 15.91s/it] 77%|███████▋  | 2549/3309 [11:08:59<3:17:14, 15.57s/it] 77%|███████▋  | 2550/3309 [11:09:15<3:21:52, 15.96s/it]                                                        {'loss': 4.8943, 'grad_norm': 16.6666316986084, 'learning_rate': 1.3179797860750654e-06, 'epoch': 0.77}
+ 77%|███████▋  | 2550/3309 [11:09:15<3:21:52, 15.96s/it] 77%|███████▋  | 2551/3309 [11:09:34<3:31:24, 16.73s/it] 77%|███████▋  | 2552/3309 [11:10:02<4:13:32, 20.10s/it] 77%|███████▋  | 2553/3309 [11:10:17<3:52:15, 18.43s/it] 77%|███████▋  | 2554/3309 [11:10:32<3:40:48, 17.55s/it] 77%|███████▋  | 2555/3309 [11:11:02<4:27:08, 21.26s/it] 77%|███████▋  | 2556/3309 [11:11:18<4:08:11, 19.78s/it] 77%|███████▋  | 2557/3309 [11:11:35<3:55:36, 18.80s/it] 77%|███████▋  | 2558/3309 [11:12:01<4:23:35, 21.06s/it] 77%|███████▋  | 2559/3309 [11:12:18<4:08:27, 19.88s/it] 77%|███████▋  | 2560/3309 [11:12:48<4:45:42, 22.89s/it]                                                        {'loss': 4.1448, 'grad_norm': 19.440494537353516, 'learning_rate': 1.2850402237629184e-06, 'epoch': 0.77}
+ 77%|███████▋  | 2560/3309 [11:12:48<4:45:42, 22.89s/it] 77%|███████▋  | 2561/3309 [11:13:04<4:20:58, 20.93s/it] 77%|███████▋  | 2562/3309 [11:13:30<4:38:48, 22.39s/it] 77%|███████▋  | 2563/3309 [11:13:45<4:11:23, 20.22s/it] 77%|███████▋  | 2564/3309 [11:14:00<3:49:39, 18.50s/it] 78%|███████▊  | 2565/3309 [11:14:17<3:42:13, 17.92s/it] 78%|███████▊  | 2566/3309 [11:14:39<3:58:19, 19.25s/it] 78%|███████▊  | 2567/3309 [11:14:58<3:58:09, 19.26s/it] 78%|███████▊  | 2568/3309 [11:15:14<3:46:50, 18.37s/it] 78%|███████▊  | 2569/3309 [11:15:29<3:31:02, 17.11s/it] 78%|███████▊  | 2570/3309 [11:15:43<3:19:41, 16.21s/it]                                                        {'loss': 3.3491, 'grad_norm': 14.674943923950195, 'learning_rate': 1.2524567114247083e-06, 'epoch': 0.78}
+ 78%|███████▊  | 2570/3309 [11:15:43<3:19:41, 16.21s/it] 78%|███████▊  | 2571/3309 [11:16:02<3:31:09, 17.17s/it] 78%|███████▊  | 2572/3309 [11:16:27<4:00:47, 19.60s/it] 78%|███████▊  | 2573/3309 [11:16:50<4:12:20, 20.57s/it] 78%|███████▊  | 2574/3309 [11:17:09<4:03:47, 19.90s/it] 78%|███████▊  | 2575/3309 [11:17:26<3:55:34, 19.26s/it] 78%|███████▊  | 2576/3309 [11:17:51<4:14:30, 20.83s/it] 78%|███████▊  | 2577/3309 [11:18:05<3:49:58, 18.85s/it] 78%|███████▊  | 2578/3309 [11:18:22<3:41:17, 18.16s/it] 78%|███████▊  | 2579/3309 [11:18:47<4:07:36, 20.35s/it] 78%|███████▊  | 2580/3309 [11:19:09<4:14:31, 20.95s/it]                                                        {'loss': 3.2897, 'grad_norm': 16.349637985229492, 'learning_rate': 1.2202323719364324e-06, 'epoch': 0.78}
+ 78%|███████▊  | 2580/3309 [11:19:09<4:14:31, 20.95s/it] 78%|███████▊  | 2581/3309 [11:19:30<4:12:34, 20.82s/it] 78%|███████▊  | 2582/3309 [11:19:51<4:12:08, 20.81s/it] 78%|███████▊  | 2583/3309 [11:20:14<4:21:32, 21.61s/it] 78%|███████▊  | 2584/3309 [11:20:35<4:19:17, 21.46s/it] 78%|███████▊  | 2585/3309 [11:20:56<4:16:41, 21.27s/it] 78%|███████▊  | 2586/3309 [11:21:25<4:43:07, 23.50s/it] 78%|███████▊  | 2587/3309 [11:21:43<4:23:42, 21.91s/it] 78%|███████▊  | 2588/3309 [11:22:09<4:39:21, 23.25s/it] 78%|███████▊  | 2589/3309 [11:22:26<4:14:49, 21.24s/it] 78%|███████▊  | 2590/3309 [11:22:42<3:56:27, 19.73s/it]                                                        {'loss': 4.0901, 'grad_norm': 19.67890739440918, 'learning_rate': 1.1883702937501708e-06, 'epoch': 0.78}
+ 78%|███████▊  | 2590/3309 [11:22:42<3:56:27, 19.73s/it] 78%|███████▊  | 2591/3309 [11:22:59<3:43:56, 18.71s/it] 78%|███████▊  | 2592/3309 [11:23:13<3:29:04, 17.50s/it] 78%|███████▊  | 2593/3309 [11:23:30<3:25:43, 17.24s/it] 78%|███████▊  | 2594/3309 [11:23:46<3:22:20, 16.98s/it] 78%|███████▊  | 2595/3309 [11:24:03<3:20:41, 16.86s/it] 78%|███████▊  | 2596/3309 [11:24:17<3:10:07, 16.00s/it] 78%|███████▊  | 2597/3309 [11:24:33<3:11:57, 16.18s/it] 79%|███████▊  | 2598/3309 [11:24:48<3:06:15, 15.72s/it] 79%|███████▊  | 2599/3309 [11:25:02<3:00:57, 15.29s/it] 79%|███████▊  | 2600/3309 [11:25:19<3:05:15, 15.68s/it]                                                        {'loss': 4.1003, 'grad_norm': 21.339618682861328, 'learning_rate': 1.1568735305980694e-06, 'epoch': 0.79}
+ 79%|███████▊  | 2600/3309 [11:25:19<3:05:15, 15.68s/it] 79%|███████▊  | 2601/3309 [11:25:36<3:08:36, 15.98s/it] 79%|███████▊  | 2602/3309 [11:25:50<3:02:46, 15.51s/it] 79%|███████▊  | 2603/3309 [11:26:04<2:58:49, 15.20s/it] 79%|███████▊  | 2604/3309 [11:26:19<2:55:51, 14.97s/it] 79%|███████▊  | 2605/3309 [11:26:36<3:04:13, 15.70s/it] 79%|███████▉  | 2606/3309 [11:26:53<3:06:04, 15.88s/it] 79%|███████▉  | 2607/3309 [11:27:09<3:08:30, 16.11s/it] 79%|███████▉  | 2608/3309 [11:27:23<3:01:33, 15.54s/it] 79%|███████▉  | 2609/3309 [11:27:38<2:58:10, 15.27s/it] 79%|███████▉  | 2610/3309 [11:27:54<3:01:14, 15.56s/it]                                                        {'loss': 3.4165, 'grad_norm': 21.269119262695312, 'learning_rate': 1.1257451011996807e-06, 'epoch': 0.79}
+ 79%|███████▉  | 2610/3309 [11:27:54<3:01:14, 15.56s/it] 79%|███████▉  | 2611/3309 [11:28:11<3:03:26, 15.77s/it] 79%|███████▉  | 2612/3309 [11:28:27<3:05:23, 15.96s/it] 79%|███████▉  | 2613/3309 [11:28:43<3:06:42, 16.10s/it] 79%|███████▉  | 2614/3309 [11:28:58<3:00:00, 15.54s/it] 79%|███████▉  | 2615/3309 [11:29:14<3:02:18, 15.76s/it] 79%|███████▉  | 2616/3309 [11:29:28<2:56:28, 15.28s/it] 79%|███████▉  | 2617/3309 [11:29:42<2:52:18, 14.94s/it] 79%|███████▉  | 2618/3309 [11:29:56<2:49:29, 14.72s/it] 79%|███████▉  | 2619/3309 [11:30:11<2:48:33, 14.66s/it] 79%|███████▉  | 2620/3309 [11:30:25<2:47:27, 14.58s/it]                                                        {'loss': 3.4622, 'grad_norm': 33.041419982910156, 'learning_rate': 1.0949879889726295e-06, 'epoch': 0.79}
+ 79%|███████▉  | 2620/3309 [11:30:25<2:47:27, 14.58s/it] 79%|███████▉  | 2621/3309 [11:30:42<2:52:57, 15.08s/it] 79%|███████▉  | 2622/3309 [11:30:58<2:56:39, 15.43s/it] 79%|███████▉  | 2623/3309 [11:31:14<2:59:09, 15.67s/it] 79%|███████▉  | 2624/3309 [11:31:28<2:53:50, 15.23s/it] 79%|███████▉  | 2625/3309 [11:31:45<2:58:25, 15.65s/it] 79%|███████▉  | 2626/3309 [11:32:01<3:01:20, 15.93s/it] 79%|███████▉  | 2627/3309 [11:32:18<3:02:07, 16.02s/it] 79%|███████▉  | 2628/3309 [11:32:34<3:03:35, 16.17s/it] 79%|███████▉  | 2629/3309 [11:32:49<2:57:59, 15.70s/it] 79%|███████▉  | 2630/3309 [11:33:03<2:52:38, 15.26s/it]                                                        {'loss': 3.4136, 'grad_norm': 28.960115432739258, 'learning_rate': 1.0646051417466801e-06, 'epoch': 0.79}
+ 79%|███████▉  | 2630/3309 [11:33:03<2:52:38, 15.26s/it] 80%|███████▉  | 2631/3309 [11:33:20<2:56:56, 15.66s/it] 80%|███████▉  | 2632/3309 [11:33:34<2:51:50, 15.23s/it] 80%|███████▉  | 2633/3309 [11:33:48<2:49:16, 15.02s/it] 80%|███████▉  | 2634/3309 [11:34:05<2:53:16, 15.40s/it] 80%|███████▉  | 2635/3309 [11:34:21<2:56:03, 15.67s/it] 80%|███████▉  | 2636/3309 [11:34:35<2:51:25, 15.28s/it] 80%|███████▉  | 2637/3309 [11:34:52<2:54:22, 15.57s/it] 80%|███████▉  | 2638/3309 [11:35:08<2:57:19, 15.86s/it] 80%|███████▉  | 2639/3309 [11:35:22<2:51:34, 15.36s/it] 80%|███████▉  | 2640/3309 [11:35:37<2:47:39, 15.04s/it]                                                        {'loss': 4.1335, 'grad_norm': 24.76239013671875, 'learning_rate': 1.0345994714812135e-06, 'epoch': 0.8}
+ 80%|███████▉  | 2640/3309 [11:35:37<2:47:39, 15.04s/it] 80%|███████▉  | 2641/3309 [11:35:53<2:51:59, 15.45s/it] 80%|███████▉  | 2642/3309 [11:36:07<2:47:38, 15.08s/it] 80%|███████▉  | 2643/3309 [11:36:21<2:44:27, 14.82s/it] 80%|███████▉  | 2644/3309 [11:36:35<2:41:30, 14.57s/it] 80%|███████▉  | 2645/3309 [11:36:50<2:40:26, 14.50s/it] 80%|███████▉  | 2646/3309 [11:37:04<2:39:02, 14.39s/it] 80%|███████▉  | 2647/3309 [11:37:18<2:38:17, 14.35s/it] 80%|████████  | 2648/3309 [11:37:35<2:44:52, 14.97s/it] 80%|████████  | 2649/3309 [11:37:51<2:50:11, 15.47s/it] 80%|████████  | 2650/3309 [11:38:06<2:45:57, 15.11s/it]                                                        {'loss': 3.2818, 'grad_norm': 15.773963928222656, 'learning_rate': 1.0049738539861332e-06, 'epoch': 0.8}
+ 80%|████████  | 2650/3309 [11:38:06<2:45:57, 15.11s/it] 80%|████████  | 2651/3309 [11:38:22<2:50:41, 15.56s/it] 80%|████████  | 2652/3309 [11:38:39<2:53:49, 15.87s/it] 80%|████████  | 2653/3309 [11:38:55<2:56:17, 16.12s/it] 80%|████████  | 2654/3309 [11:39:10<2:51:12, 15.68s/it] 80%|████████  | 2655/3309 [11:39:27<2:53:19, 15.90s/it] 80%|████████  | 2656/3309 [11:39:43<2:55:39, 16.14s/it] 80%|████████  | 2657/3309 [11:40:00<2:57:17, 16.32s/it] 80%|████████  | 2658/3309 [11:40:14<2:50:25, 15.71s/it] 80%|████████  | 2659/3309 [11:40:28<2:44:30, 15.19s/it] 80%|████████  | 2660/3309 [11:40:45<2:48:05, 15.54s/it]                                                        {'loss': 4.1348, 'grad_norm': 21.248395919799805, 'learning_rate': 9.757311286462428e-07, 'epoch': 0.8}
+ 80%|████████  | 2660/3309 [11:40:45<2:48:05, 15.54s/it] 80%|████████  | 2661/3309 [11:40:59<2:43:40, 15.16s/it] 80%|████████  | 2662/3309 [11:41:15<2:47:13, 15.51s/it] 80%|████████  | 2663/3309 [11:41:32<2:51:44, 15.95s/it] 81%|████████  | 2664/3309 [11:41:46<2:45:01, 15.35s/it] 81%|████████  | 2665/3309 [11:42:00<2:41:42, 15.07s/it] 81%|████████  | 2666/3309 [11:42:17<2:46:33, 15.54s/it] 81%|████████  | 2667/3309 [11:42:31<2:41:09, 15.06s/it] 81%|████████  | 2668/3309 [11:42:47<2:44:52, 15.43s/it] 81%|████████  | 2669/3309 [11:43:02<2:41:09, 15.11s/it] 81%|████████  | 2670/3309 [11:43:18<2:45:52, 15.57s/it]                                                        {'loss': 4.1947, 'grad_norm': 23.75290298461914, 'learning_rate': 9.468740981491143e-07, 'epoch': 0.81}
+ 81%|████████  | 2670/3309 [11:43:18<2:45:52, 15.57s/it] 81%|████████  | 2671/3309 [11:43:35<2:49:00, 15.89s/it] 81%|████████  | 2672/3309 [11:43:51<2:50:02, 16.02s/it] 81%|████████  | 2673/3309 [11:44:06<2:45:31, 15.62s/it] 81%|████████  | 2674/3309 [11:44:22<2:47:24, 15.82s/it] 81%|████████  | 2675/3309 [11:44:39<2:48:37, 15.96s/it] 81%|████████  | 2676/3309 [11:44:56<2:51:31, 16.26s/it] 81%|████████  | 2677/3309 [11:45:10<2:44:36, 15.63s/it] 81%|████████  | 2678/3309 [11:45:24<2:41:08, 15.32s/it] 81%|████████  | 2679/3309 [11:45:41<2:44:11, 15.64s/it] 81%|████████  | 2680/3309 [11:45:57<2:47:05, 15.94s/it]                                                        {'loss': 4.0364, 'grad_norm': 16.7280330657959, 'learning_rate': 9.1840552821647e-07, 'epoch': 0.81}
+ 81%|████████  | 2680/3309 [11:45:57<2:47:05, 15.94s/it] 81%|████████  | 2681/3309 [11:46:12<2:41:22, 15.42s/it] 81%|████████  | 2682/3309 [11:46:28<2:45:00, 15.79s/it] 81%|████████  | 2683/3309 [11:46:44<2:46:19, 15.94s/it] 81%|████████  | 2684/3309 [11:47:01<2:47:00, 16.03s/it] 81%|████████  | 2685/3309 [11:47:15<2:42:24, 15.62s/it] 81%|████████  | 2686/3309 [11:47:32<2:44:23, 15.83s/it] 81%|████████  | 2687/3309 [11:47:48<2:45:47, 15.99s/it] 81%|████████  | 2688/3309 [11:48:05<2:47:28, 16.18s/it] 81%|████████▏ | 2689/3309 [11:48:21<2:48:49, 16.34s/it] 81%|████████▏ | 2690/3309 [11:48:38<2:48:44, 16.36s/it]                                                        {'loss': 3.3641, 'grad_norm': 17.696247100830078, 'learning_rate': 8.903281473391152e-07, 'epoch': 0.81}
+ 81%|████████▏ | 2690/3309 [11:48:38<2:48:44, 16.36s/it] 81%|████████▏ | 2691/3309 [11:48:52<2:41:57, 15.72s/it] 81%|████████▏ | 2692/3309 [11:49:07<2:38:18, 15.39s/it] 81%|████████▏ | 2693/3309 [11:49:21<2:34:34, 15.06s/it] 81%|████████▏ | 2694/3309 [11:49:38<2:39:16, 15.54s/it] 81%|████████▏ | 2695/3309 [11:49:54<2:42:48, 15.91s/it] 81%|████████▏ | 2696/3309 [11:50:11<2:43:50, 16.04s/it] 82%|████████▏ | 2697/3309 [11:50:25<2:39:20, 15.62s/it] 82%|████████▏ | 2698/3309 [11:50:40<2:35:35, 15.28s/it] 82%|████████▏ | 2699/3309 [11:50:56<2:38:19, 15.57s/it] 82%|████████▏ | 2700/3309 [11:51:12<2:40:20, 15.80s/it]                                                        {'loss': 5.7446, 'grad_norm': 16.840299606323242, 'learning_rate': 8.62644646515427e-07, 'epoch': 0.82}
+ 82%|████████▏ | 2700/3309 [11:51:12<2:40:20, 15.80s/it] 82%|████████▏ | 2701/3309 [11:51:27<2:35:14, 15.32s/it] 82%|████████▏ | 2702/3309 [11:51:41<2:31:43, 15.00s/it] 82%|████████▏ | 2703/3309 [11:51:56<2:30:33, 14.91s/it] 82%|████████▏ | 2704/3309 [11:52:12<2:34:28, 15.32s/it] 82%|████████▏ | 2705/3309 [11:52:26<2:30:48, 14.98s/it] 82%|████████▏ | 2706/3309 [11:52:42<2:34:36, 15.38s/it] 82%|████████▏ | 2707/3309 [11:52:59<2:36:57, 15.64s/it] 82%|████████▏ | 2708/3309 [11:53:15<2:38:38, 15.84s/it] 82%|████████▏ | 2709/3309 [11:53:31<2:39:31, 15.95s/it] 82%|████████▏ | 2710/3309 [11:53:47<2:40:12, 16.05s/it]                                                        {'loss': 3.3763, 'grad_norm': 13.25534725189209, 'learning_rate': 8.353576789934436e-07, 'epoch': 0.82}
+ 82%|████████▏ | 2710/3309 [11:53:47<2:40:12, 16.05s/it] 82%|████████▏ | 2711/3309 [11:54:04<2:41:00, 16.16s/it] 82%|████████▏ | 2712/3309 [11:54:18<2:34:46, 15.55s/it] 82%|████████▏ | 2713/3309 [11:54:32<2:29:39, 15.07s/it] 82%|████████▏ | 2714/3309 [11:54:46<2:26:43, 14.80s/it] 82%|████████▏ | 2715/3309 [11:55:00<2:23:40, 14.51s/it] 82%|████████▏ | 2716/3309 [11:55:14<2:22:39, 14.43s/it] 82%|████████▏ | 2717/3309 [11:55:28<2:21:45, 14.37s/it] 82%|████████▏ | 2718/3309 [11:55:45<2:27:26, 14.97s/it] 82%|████████▏ | 2719/3309 [11:55:59<2:24:14, 14.67s/it] 82%|████████▏ | 2720/3309 [11:56:13<2:22:45, 14.54s/it]                                                        {'loss': 3.5133, 'grad_norm': 19.88932991027832, 'learning_rate': 8.084698600165797e-07, 'epoch': 0.82}
+ 82%|████████▏ | 2720/3309 [11:56:13<2:22:45, 14.54s/it] 82%|████████▏ | 2721/3309 [11:56:29<2:27:56, 15.10s/it] 82%|████████▏ | 2722/3309 [11:56:43<2:24:12, 14.74s/it] 82%|████████▏ | 2723/3309 [11:56:58<2:23:39, 14.71s/it] 82%|████████▏ | 2724/3309 [11:57:14<2:28:13, 15.20s/it] 82%|████████▏ | 2725/3309 [11:57:31<2:32:06, 15.63s/it] 82%|████████▏ | 2726/3309 [11:57:47<2:33:45, 15.82s/it] 82%|████████▏ | 2727/3309 [11:58:01<2:28:49, 15.34s/it] 82%|████████▏ | 2728/3309 [11:58:16<2:25:06, 14.99s/it] 82%|████████▏ | 2729/3309 [11:58:30<2:23:30, 14.85s/it] 83%|████████▎ | 2730/3309 [11:58:46<2:27:41, 15.31s/it]                                                        {'loss': 4.1018, 'grad_norm': 17.921199798583984, 'learning_rate': 7.819837665729596e-07, 'epoch': 0.82}
+ 83%|████████▎ | 2730/3309 [11:58:46<2:27:41, 15.31s/it] 83%|████████▎ | 2731/3309 [11:59:01<2:24:19, 14.98s/it] 83%|████████▎ | 2732/3309 [11:59:18<2:31:08, 15.72s/it] 83%|████████▎ | 2733/3309 [11:59:34<2:32:51, 15.92s/it] 83%|████████▎ | 2734/3309 [11:59:51<2:33:45, 16.04s/it] 83%|████████▎ | 2735/3309 [12:00:10<2:41:09, 16.85s/it] 83%|████████▎ | 2736/3309 [12:00:26<2:40:14, 16.78s/it] 83%|████████▎ | 2737/3309 [12:00:42<2:38:36, 16.64s/it] 83%|████████▎ | 2738/3309 [12:00:59<2:37:32, 16.56s/it] 83%|████████▎ | 2739/3309 [12:01:15<2:36:39, 16.49s/it] 83%|████████▎ | 2740/3309 [12:01:30<2:30:28, 15.87s/it]                                                        {'loss': 3.3378, 'grad_norm': 29.57664680480957, 'learning_rate': 7.559019371484521e-07, 'epoch': 0.83}
+ 83%|████████▎ | 2740/3309 [12:01:30<2:30:28, 15.87s/it] 83%|████████▎ | 2741/3309 [12:01:46<2:32:21, 16.09s/it] 83%|████████▎ | 2742/3309 [12:02:00<2:26:54, 15.55s/it] 83%|████████▎ | 2743/3309 [12:02:17<2:28:59, 15.79s/it] 83%|████████▎ | 2744/3309 [12:02:31<2:24:55, 15.39s/it] 83%|████████▎ | 2745/3309 [12:02:48<2:27:21, 15.68s/it] 83%|████████▎ | 2746/3309 [12:03:02<2:23:07, 15.25s/it] 83%|████████▎ | 2747/3309 [12:03:18<2:25:57, 15.58s/it] 83%|████████▎ | 2748/3309 [12:03:33<2:22:00, 15.19s/it] 83%|████████▎ | 2749/3309 [12:03:47<2:20:10, 15.02s/it] 83%|████████▎ | 2750/3309 [12:04:03<2:23:33, 15.41s/it]                                                        {'loss': 4.1487, 'grad_norm': 17.720863342285156, 'learning_rate': 7.302268714833622e-07, 'epoch': 0.83}
+ 83%|████████▎ | 2750/3309 [12:04:03<2:23:33, 15.41s/it] 83%|████████▎ | 2751/3309 [12:04:20<2:25:42, 15.67s/it] 83%|████████▎ | 2752/3309 [12:04:34<2:21:13, 15.21s/it] 83%|████████▎ | 2753/3309 [12:04:50<2:23:43, 15.51s/it] 83%|████████▎ | 2754/3309 [12:05:06<2:25:40, 15.75s/it] 83%|████████▎ | 2755/3309 [12:05:21<2:21:41, 15.35s/it] 83%|████████▎ | 2756/3309 [12:05:37<2:24:02, 15.63s/it] 83%|████████▎ | 2757/3309 [12:05:51<2:19:59, 15.22s/it] 83%|████████▎ | 2758/3309 [12:06:08<2:22:40, 15.54s/it] 83%|████████▎ | 2759/3309 [12:06:24<2:24:35, 15.77s/it] 83%|████████▎ | 2760/3309 [12:06:38<2:20:06, 15.31s/it]                                                        {'loss': 3.5199, 'grad_norm': 17.34684944152832, 'learning_rate': 7.049610303328541e-07, 'epoch': 0.83}
+ 83%|████████▎ | 2760/3309 [12:06:38<2:20:06, 15.31s/it] 83%|████████▎ | 2761/3309 [12:06:53<2:18:40, 15.18s/it] 83%|████████▎ | 2762/3309 [12:07:10<2:23:06, 15.70s/it] 83%|████████▎ | 2763/3309 [12:07:24<2:19:31, 15.33s/it] 84%|████████▎ | 2764/3309 [12:07:39<2:17:12, 15.11s/it] 84%|████████▎ | 2765/3309 [12:07:55<2:20:38, 15.51s/it] 84%|████████▎ | 2766/3309 [12:08:15<2:31:51, 16.78s/it] 84%|████████▎ | 2767/3309 [12:08:41<2:54:45, 19.35s/it] 84%|████████▎ | 2768/3309 [12:09:12<3:27:34, 23.02s/it] 84%|████████▎ | 2769/3309 [12:09:40<3:40:38, 24.52s/it] 84%|████████▎ | 2770/3309 [12:10:12<4:00:23, 26.76s/it]                                                        {'loss': 4.2899, 'grad_norm': 16.739910125732422, 'learning_rate': 6.80106835231113e-07, 'epoch': 0.84}
+ 84%|████████▎ | 2770/3309 [12:10:12<4:00:23, 26.76s/it] 84%|████████▎ | 2771/3309 [12:10:44<4:13:01, 28.22s/it] 84%|████████▍ | 2772/3309 [12:11:15<4:21:39, 29.24s/it] 84%|████████▍ | 2773/3309 [12:11:42<4:13:30, 28.38s/it] 84%|████████▍ | 2774/3309 [12:12:14<4:24:09, 29.63s/it] 84%|████████▍ | 2775/3309 [12:12:42<4:19:37, 29.17s/it] 84%|████████▍ | 2776/3309 [12:13:11<4:16:45, 28.90s/it] 84%|████████▍ | 2777/3309 [12:13:39<4:14:15, 28.67s/it] 84%|████████▍ | 2778/3309 [12:14:05<4:07:39, 27.98s/it] 84%|████████▍ | 2779/3309 [12:14:32<4:03:56, 27.62s/it] 84%|████████▍ | 2780/3309 [12:15:00<4:05:27, 27.84s/it]                                                        {'loss': 3.3016, 'grad_norm': 17.1294002532959, 'learning_rate': 6.556666682592494e-07, 'epoch': 0.84}
+ 84%|████████▍ | 2780/3309 [12:15:00<4:05:27, 27.84s/it] 84%|████████▍ | 2781/3309 [12:15:20<3:43:00, 25.34s/it] 84%|████████▍ | 2782/3309 [12:15:34<3:12:42, 21.94s/it] 84%|████████▍ | 2783/3309 [12:15:50<2:58:20, 20.34s/it] 84%|████████▍ | 2784/3309 [12:16:07<2:48:01, 19.20s/it] 84%|████████▍ | 2785/3309 [12:16:23<2:40:15, 18.35s/it] 84%|████████▍ | 2786/3309 [12:16:38<2:30:50, 17.31s/it] 84%|████████▍ | 2787/3309 [12:16:54<2:27:50, 16.99s/it] 84%|████████▍ | 2788/3309 [12:17:09<2:20:15, 16.15s/it] 84%|████████▍ | 2789/3309 [12:17:25<2:20:36, 16.22s/it] 84%|████████▍ | 2790/3309 [12:17:41<2:20:32, 16.25s/it]                                                        {'loss': 2.4169, 'grad_norm': 14.801079750061035, 'learning_rate': 6.316428718170037e-07, 'epoch': 0.84}
+ 84%|████████▍ | 2790/3309 [12:17:41<2:20:32, 16.25s/it] 84%|████████▍ | 2791/3309 [12:17:55<2:14:16, 15.55s/it] 84%|████████▍ | 2792/3309 [12:18:10<2:11:21, 15.25s/it] 84%|████████▍ | 2793/3309 [12:18:26<2:13:49, 15.56s/it] 84%|████████▍ | 2794/3309 [12:18:40<2:09:26, 15.08s/it] 84%|████████▍ | 2795/3309 [12:18:56<2:12:21, 15.45s/it] 84%|████████▍ | 2796/3309 [12:19:11<2:08:50, 15.07s/it] 85%|████████▍ | 2797/3309 [12:19:25<2:07:01, 14.89s/it] 85%|████████▍ | 2798/3309 [12:19:41<2:10:36, 15.34s/it] 85%|████████▍ | 2799/3309 [12:19:58<2:13:07, 15.66s/it] 85%|████████▍ | 2800/3309 [12:20:14<2:15:01, 15.92s/it]                                                        {'loss': 3.2883, 'grad_norm': 19.354856491088867, 'learning_rate': 6.080377483982425e-07, 'epoch': 0.85}
+ 85%|████████▍ | 2800/3309 [12:20:14<2:15:01, 15.92s/it] 85%|���███████▍ | 2801/3309 [12:20:31<2:16:16, 16.09s/it] 85%|████████▍ | 2802/3309 [12:20:47<2:16:50, 16.19s/it] 85%|████████▍ | 2803/3309 [12:21:02<2:12:12, 15.68s/it] 85%|████████▍ | 2804/3309 [12:21:18<2:14:22, 15.97s/it] 85%|████████▍ | 2805/3309 [12:21:33<2:11:03, 15.60s/it] 85%|████████▍ | 2806/3309 [12:21:47<2:07:04, 15.16s/it] 85%|████████▍ | 2807/3309 [12:22:07<2:17:27, 16.43s/it] 85%|████████▍ | 2808/3309 [12:22:38<2:55:30, 21.02s/it] 85%|████████▍ | 2809/3309 [12:23:10<3:20:44, 24.09s/it] 85%|████████▍ | 2810/3309 [12:23:36<3:26:15, 24.80s/it]                                                        {'loss': 3.3497, 'grad_norm': 17.925838470458984, 'learning_rate': 5.848535603702798e-07, 'epoch': 0.85}
+ 85%|████████▍ | 2810/3309 [12:23:36<3:26:15, 24.80s/it] 85%|████████▍ | 2811/3309 [12:24:03<3:29:50, 25.28s/it] 85%|████████▍ | 2812/3309 [12:24:30<3:35:59, 26.08s/it] 85%|████████▌ | 2813/3309 [12:24:56<3:33:15, 25.80s/it] 85%|████████▌ | 2814/3309 [12:25:20<3:28:29, 25.27s/it] 85%|████████▌ | 2815/3309 [12:25:46<3:31:37, 25.70s/it] 85%|████████▌ | 2816/3309 [12:26:15<3:38:56, 26.65s/it] 85%|████████▌ | 2817/3309 [12:26:38<3:30:05, 25.62s/it] 85%|████████▌ | 2818/3309 [12:27:04<3:28:36, 25.49s/it] 85%|████████▌ | 2819/3309 [12:27:27<3:22:18, 24.77s/it] 85%|████████▌ | 2820/3309 [12:27:43<3:01:56, 22.32s/it]                                                        {'loss': 6.4132, 'grad_norm': 20.340959548950195, 'learning_rate': 5.62092529757054e-07, 'epoch': 0.85}
+ 85%|████████▌ | 2820/3309 [12:27:43<3:01:56, 22.32s/it] 85%|████████▌ | 2821/3309 [12:28:09<3:08:54, 23.23s/it] 85%|████████▌ | 2822/3309 [12:28:23<2:45:45, 20.42s/it] 85%|████████▌ | 2823/3309 [12:28:39<2:35:25, 19.19s/it] 85%|████████▌ | 2824/3309 [12:28:53<2:22:51, 17.67s/it] 85%|████████▌ | 2825/3309 [12:29:10<2:20:06, 17.37s/it] 85%|████████▌ | 2826/3309 [12:29:26<2:17:19, 17.06s/it] 85%|████████▌ | 2827/3309 [12:29:43<2:15:53, 16.92s/it] 85%|████████▌ | 2828/3309 [12:30:01<2:19:50, 17.44s/it] 85%|████████▌ | 2829/3309 [12:30:18<2:16:48, 17.10s/it] 86%|████████▌ | 2830/3309 [12:30:32<2:09:36, 16.23s/it]                                                        {'loss': 2.3404, 'grad_norm': 21.507797241210938, 'learning_rate': 5.397568380261559e-07, 'epoch': 0.86}
+ 86%|████████▌ | 2830/3309 [12:30:32<2:09:36, 16.23s/it] 86%|████████▌ | 2831/3309 [12:30:46<2:05:21, 15.74s/it] 86%|████████▌ | 2832/3309 [12:31:00<2:01:16, 15.26s/it] 86%|████████▌ | 2833/3309 [12:31:15<1:58:37, 14.95s/it] 86%|████████▌ | 2834/3309 [12:31:31<2:02:17, 15.45s/it] 86%|████████▌ | 2835/3309 [12:31:48<2:04:05, 15.71s/it] 86%|████████▌ | 2836/3309 [12:32:04<2:06:06, 16.00s/it] 86%|████████▌ | 2837/3309 [12:32:21<2:06:55, 16.13s/it] 86%|████████▌ | 2838/3309 [12:32:37<2:07:18, 16.22s/it] 86%|████████▌ | 2839/3309 [12:32:54<2:07:27, 16.27s/it] 86%|████████▌ | 2840/3309 [12:33:08<2:02:39, 15.69s/it]                                                        {'loss': 4.0876, 'grad_norm': 16.9514102935791, 'learning_rate': 5.178486258797555e-07, 'epoch': 0.86}
+ 86%|████████▌ | 2840/3309 [12:33:08<2:02:39, 15.69s/it] 86%|████████▌ | 2841/3309 [12:33:23<2:00:27, 15.44s/it] 86%|████████▌ | 2842/3309 [12:33:37<1:58:14, 15.19s/it] 86%|████████▌ | 2843/3309 [12:33:54<2:01:06, 15.59s/it] 86%|████████▌ | 2844/3309 [12:34:10<2:03:13, 15.90s/it] 86%|████████▌ | 2845/3309 [12:34:27<2:04:55, 16.15s/it] 86%|████████▌ | 2846/3309 [12:34:51<2:22:45, 18.50s/it] 86%|████████▌ | 2847/3309 [12:35:24<2:55:04, 22.74s/it] 86%|████████▌ | 2848/3309 [12:35:56<3:17:17, 25.68s/it] 86%|████████▌ | 2849/3309 [12:36:23<3:19:45, 26.05s/it] 86%|████████▌ | 2850/3309 [12:36:56<3:33:53, 27.96s/it]                                                        {'loss': 3.3715, 'grad_norm': 14.505171775817871, 'learning_rate': 4.963699930494365e-07, 'epoch': 0.86}
+ 86%|████████▌ | 2850/3309 [12:36:56<3:33:53, 27.96s/it] 86%|████████▌ | 2851/3309 [12:37:21<3:26:11, 27.01s/it] 86%|████████▌ | 2852/3309 [12:37:48<3:25:43, 27.01s/it] 86%|████████▌ | 2853/3309 [12:38:14<3:24:44, 26.94s/it] 86%|████████▌ | 2854/3309 [12:38:46<3:35:39, 28.44s/it] 86%|████████▋ | 2855/3309 [12:39:13<3:31:48, 27.99s/it] 86%|████████▋ | 2856/3309 [12:39:40<3:29:07, 27.70s/it] 86%|████████▋ | 2857/3309 [12:40:07<3:25:58, 27.34s/it] 86%|████████▋ | 2858/3309 [12:40:39<3:36:58, 28.87s/it] 86%|████████▋ | 2859/3309 [12:41:06<3:32:34, 28.34s/it] 86%|████████▋ | 2860/3309 [12:41:35<3:32:34, 28.41s/it]                                                        {'loss': 4.2347, 'grad_norm': 22.551313400268555, 'learning_rate': 4.75322998094942e-07, 'epoch': 0.86}
+ 86%|████████▋ | 2860/3309 [12:41:35<3:32:34, 28.41s/it] 86%|████████▋ | 2861/3309 [12:41:51<3:05:44, 24.88s/it] 86%|████████▋ | 2862/3309 [12:42:08<2:46:08, 22.30s/it] 87%|████████▋ | 2863/3309 [12:42:24<2:32:27, 20.51s/it] 87%|████████▋ | 2864/3309 [12:42:40<2:22:39, 19.24s/it] 87%|████████▋ | 2865/3309 [12:42:55<2:11:16, 17.74s/it] 87%|████████▋ | 2866/3309 [12:43:09<2:04:03, 16.80s/it] 87%|████████▋ | 2867/3309 [12:43:23<1:57:29, 15.95s/it] 87%|████████▋ | 2868/3309 [12:43:40<1:58:52, 16.17s/it] 87%|████████▋ | 2869/3309 [12:43:56<1:58:57, 16.22s/it] 87%|████████▋ | 2870/3309 [12:44:10<1:54:18, 15.62s/it]                                                        {'loss': 2.5903, 'grad_norm': 20.145078659057617, 'learning_rate': 4.5470965820689384e-07, 'epoch': 0.87}
+ 87%|████████▋ | 2870/3309 [12:44:10<1:54:18, 15.62s/it] 87%|████████▋ | 2871/3309 [12:44:25<1:52:34, 15.42s/it] 87%|████████▋ | 2872/3309 [12:44:42<1:54:18, 15.69s/it] 87%|████████▋ | 2873/3309 [12:44:58<1:56:09, 15.98s/it] 87%|████████▋ | 2874/3309 [12:45:15<1:56:35, 16.08s/it] 87%|████████▋ | 2875/3309 [12:45:31<1:57:29, 16.24s/it] 87%|████████▋ | 2876/3309 [12:45:48<1:57:09, 16.23s/it] 87%|████████▋ | 2877/3309 [12:46:02<1:53:03, 15.70s/it] 87%|████████▋ | 2878/3309 [12:46:18<1:54:06, 15.89s/it] 87%|████████▋ | 2879/3309 [12:46:33<1:50:17, 15.39s/it] 87%|████████▋ | 2880/3309 [12:46:49<1:52:35, 15.75s/it]                                                        {'loss': 3.0177, 'grad_norm': 17.447914123535156, 'learning_rate': 4.345319490134453e-07, 'epoch': 0.87}
+ 87%|████████▋ | 2880/3309 [12:46:49<1:52:35, 15.75s/it] 87%|████████▋ | 2881/3309 [12:47:05<1:53:38, 15.93s/it] 87%|████████▋ | 2882/3309 [12:47:22<1:54:48, 16.13s/it] 87%|████████▋ | 2883/3309 [12:47:36<1:50:32, 15.57s/it] 87%|████████▋ | 2884/3309 [12:47:51<1:48:28, 15.31s/it] 87%|████████▋ | 2885/3309 [12:48:07<1:50:18, 15.61s/it] 87%|████████▋ | 2886/3309 [12:48:22<1:48:02, 15.32s/it] 87%|████████▋ | 2887/3309 [12:48:36<1:44:46, 14.90s/it] 87%|████████▋ | 2888/3309 [12:48:51<1:43:59, 14.82s/it] 87%|████████▋ | 2889/3309 [12:49:05<1:42:21, 14.62s/it] 87%|████████▋ | 2890/3309 [12:49:19<1:41:06, 14.48s/it]                                                        {'loss': 4.764, 'grad_norm': 16.10365104675293, 'learning_rate': 4.147918043909405e-07, 'epoch': 0.87}
+ 87%|████████▋ | 2890/3309 [12:49:19<1:41:06, 14.48s/it] 87%|████████▋ | 2891/3309 [12:49:35<1:45:25, 15.13s/it] 87%|████████▋ | 2892/3309 [12:49:52<1:47:33, 15.48s/it] 87%|████████▋ | 2893/3309 [12:50:06<1:45:32, 15.22s/it] 87%|████████▋ | 2894/3309 [12:50:23<1:48:11, 15.64s/it] 87%|████████▋ | 2895/3309 [12:50:40<1:50:01, 15.95s/it] 88%|████████▊ | 2896/3309 [12:50:56<1:50:28, 16.05s/it] 88%|████████▊ | 2897/3309 [12:51:11<1:47:18, 15.63s/it] 88%|████████▊ | 2898/3309 [12:51:25<1:45:08, 15.35s/it] 88%|████████▊ | 2899/3309 [12:51:39<1:42:26, 14.99s/it] 88%|████████▊ | 2900/3309 [12:51:56<1:45:36, 15.49s/it]                                                        {'loss': 4.7699, 'grad_norm': 19.066129684448242, 'learning_rate': 3.9549111627856794e-07, 'epoch': 0.88}
+ 88%|████████▊ | 2900/3309 [12:51:56<1:45:36, 15.49s/it] 88%|████████▊ | 2901/3309 [12:52:11<1:44:06, 15.31s/it] 88%|████████▊ | 2902/3309 [12:52:27<1:45:52, 15.61s/it] 88%|████████▊ | 2903/3309 [12:52:44<1:47:47, 15.93s/it] 88%|████████▊ | 2904/3309 [12:53:00<1:48:16, 16.04s/it] 88%|████████▊ | 2905/3309 [12:53:17<1:48:42, 16.14s/it] 88%|████████▊ | 2906/3309 [12:53:31<1:44:55, 15.62s/it] 88%|████████▊ | 2907/3309 [12:53:46<1:42:42, 15.33s/it] 88%|████████▊ | 2908/3309 [12:54:00<1:39:34, 14.90s/it] 88%|████████▊ | 2909/3309 [12:54:16<1:42:22, 15.36s/it] 88%|████████▊ | 2910/3309 [12:54:30<1:39:54, 15.02s/it]                                                        {'loss': 4.1165, 'grad_norm': 19.604887008666992, 'learning_rate': 3.766317344970288e-07, 'epoch': 0.88}
+ 88%|████████▊ | 2910/3309 [12:54:30<1:39:54, 15.02s/it] 88%|████████▊ | 2911/3309 [12:54:47<1:42:14, 15.41s/it] 88%|████████▊ | 2912/3309 [12:55:01<1:39:28, 15.03s/it] 88%|████████▊ | 2913/3309 [12:55:17<1:42:26, 15.52s/it] 88%|████████▊ | 2914/3309 [12:55:34<1:44:19, 15.85s/it] 88%|████████▊ | 2915/3309 [12:55:52<1:48:24, 16.51s/it] 88%|████████▊ | 2916/3309 [12:56:11<1:52:21, 17.15s/it] 88%|████████▊ | 2917/3309 [12:56:32<2:00:59, 18.52s/it] 88%|████████▊ | 2918/3309 [12:56:53<2:04:45, 19.15s/it] 88%|████████▊ | 2919/3309 [12:57:09<1:58:51, 18.29s/it] 88%|████████▊ | 2920/3309 [12:57:26<1:55:21, 17.79s/it]                                                        {'loss': 2.4443, 'grad_norm': 17.465734481811523, 'learning_rate': 3.582154665712473e-07, 'epoch': 0.88}
+ 88%|████████▊ | 2920/3309 [12:57:26<1:55:21, 17.79s/it] 88%|████████▊ | 2921/3309 [12:57:41<1:48:48, 16.83s/it] 88%|████████▊ | 2922/3309 [12:57:55<1:44:17, 16.17s/it] 88%|████████▊ | 2923/3309 [12:58:11<1:44:18, 16.21s/it] 88%|████████▊ | 2924/3309 [12:58:28<1:44:16, 16.25s/it] 88%|████████▊ | 2925/3309 [12:58:42<1:40:13, 15.66s/it] 88%|████████▊ | 2926/3309 [12:58:58<1:41:12, 15.85s/it] 88%|████████▊ | 2927/3309 [12:59:15<1:41:52, 16.00s/it] 88%|████████▊ | 2928/3309 [12:59:31<1:42:44, 16.18s/it] 89%|████████▊ | 2929/3309 [12:59:46<1:38:51, 15.61s/it] 89%|████████▊ | 2930/3309 [13:00:02<1:40:29, 15.91s/it]                                                        {'loss': 4.0664, 'grad_norm': 22.400236129760742, 'learning_rate': 3.402440775571364e-07, 'epoch': 0.89}
+ 89%|████████▊ | 2930/3309 [13:00:02<1:40:29, 15.91s/it] 89%|████████▊ | 2931/3309 [13:00:18<1:39:09, 15.74s/it] 89%|████████▊ | 2932/3309 [13:00:32<1:36:02, 15.29s/it] 89%|████████▊ | 2933/3309 [13:00:46<1:34:27, 15.07s/it] 89%|████████▊ | 2934/3309 [13:01:01<1:33:32, 14.97s/it] 89%|████████▊ | 2935/3309 [13:01:18<1:36:30, 15.48s/it] 89%|████████▊ | 2936/3309 [13:01:34<1:37:49, 15.74s/it] 89%|████████▉ | 2937/3309 [13:01:50<1:38:34, 15.90s/it] 89%|████████▉ | 2938/3309 [13:02:05<1:35:21, 15.42s/it] 89%|████████▉ | 2939/3309 [13:02:20<1:34:47, 15.37s/it] 89%|████████▉ | 2940/3309 [13:02:37<1:37:00, 15.77s/it]                                                        {'loss': 5.7203, 'grad_norm': 21.420312881469727, 'learning_rate': 3.227192898724252e-07, 'epoch': 0.89}
+ 89%|████████▉ | 2940/3309 [13:02:37<1:37:00, 15.77s/it] 89%|████████▉ | 2941/3309 [13:02:53<1:37:53, 15.96s/it] 89%|████████▉ | 2942/3309 [13:03:09<1:38:16, 16.07s/it] 89%|████████▉ | 2943/3309 [13:03:24<1:35:12, 15.61s/it] 89%|████████▉ | 2944/3309 [13:03:40<1:36:10, 15.81s/it] 89%|████████▉ | 2945/3309 [13:03:57<1:37:23, 16.05s/it] 89%|████████▉ | 2946/3309 [13:04:11<1:33:23, 15.44s/it] 89%|████████▉ | 2947/3309 [13:04:27<1:34:46, 15.71s/it] 89%|████████▉ | 2948/3309 [13:04:44<1:35:39, 15.90s/it] 89%|████████▉ | 2949/3309 [13:05:00<1:36:06, 16.02s/it] 89%|████████▉ | 2950/3309 [13:05:16<1:36:19, 16.10s/it]                                                        {'loss': 3.367, 'grad_norm': 23.331478118896484, 'learning_rate': 3.056427831315878e-07, 'epoch': 0.89}
+ 89%|████████▉ | 2950/3309 [13:05:16<1:36:19, 16.10s/it] 89%|████████▉ | 2951/3309 [13:05:32<1:36:19, 16.14s/it] 89%|████████▉ | 2952/3309 [13:05:49<1:36:53, 16.28s/it] 89%|████████▉ | 2953/3309 [13:06:04<1:33:36, 15.78s/it] 89%|████████▉ | 2954/3309 [13:06:18<1:30:47, 15.35s/it] 89%|████████▉ | 2955/3309 [13:06:37<1:36:35, 16.37s/it] 89%|████████▉ | 2956/3309 [13:06:56<1:41:11, 17.20s/it] 89%|████████▉ | 2957/3309 [13:07:10<1:35:42, 16.31s/it] 89%|████████▉ | 2958/3309 [13:07:24<1:31:45, 15.69s/it] 89%|████████▉ | 2959/3309 [13:07:39<1:29:43, 15.38s/it] 89%|████████▉ | 2960/3309 [13:07:53<1:27:28, 15.04s/it]                                                        {'loss': 4.1604, 'grad_norm': 21.29648208618164, 'learning_rate': 2.890161939848535e-07, 'epoch': 0.89}
+ 89%|████████▉ | 2960/3309 [13:07:53<1:27:28, 15.04s/it] 89%|████████▉ | 2961/3309 [13:08:10<1:29:36, 15.45s/it] 90%|████████▉ | 2962/3309 [13:08:24<1:27:09, 15.07s/it] 90%|████████▉ | 2963/3309 [13:08:40<1:28:55, 15.42s/it] 90%|████████▉ | 2964/3309 [13:08:54<1:26:46, 15.09s/it] 90%|████████▉ | 2965/3309 [13:09:11<1:28:44, 15.48s/it] 90%|████████▉ | 2966/3309 [13:09:25<1:26:19, 15.10s/it] 90%|████████▉ | 2967/3309 [13:09:41<1:28:11, 15.47s/it] 90%|████████▉ | 2968/3309 [13:09:56<1:26:17, 15.18s/it] 90%|████████▉ | 2969/3309 [13:10:10<1:25:04, 15.01s/it] 90%|████████▉ | 2970/3309 [13:10:27<1:27:34, 15.50s/it]                                                        {'loss': 4.2335, 'grad_norm': 15.172201156616211, 'learning_rate': 2.72841115961357e-07, 'epoch': 0.9}
+ 90%|████████▉ | 2970/3309 [13:10:27<1:27:34, 15.50s/it] 90%|████████▉ | 2971/3309 [13:10:46<1:32:51, 16.48s/it] 90%|████████▉ | 2972/3309 [13:11:00<1:28:49, 15.81s/it] 90%|████████▉ | 2973/3309 [13:11:14<1:25:39, 15.30s/it] 90%|████████▉ | 2974/3309 [13:11:30<1:27:06, 15.60s/it] 90%|████████▉ | 2975/3309 [13:11:47<1:27:42, 15.76s/it] 90%|████████▉ | 2976/3309 [13:12:03<1:28:28, 15.94s/it] 90%|████████▉ | 2977/3309 [13:12:19<1:28:46, 16.05s/it] 90%|████████▉ | 2978/3309 [13:12:34<1:25:51, 15.56s/it] 90%|█████████ | 2979/3309 [13:12:48<1:24:02, 15.28s/it] 90%|█████████ | 2980/3309 [13:13:03<1:22:03, 14.96s/it]                                                        {'loss': 3.9793, 'grad_norm': 16.736038208007812, 'learning_rate': 2.5711909931640633e-07, 'epoch': 0.9}
+ 90%|█████████ | 2980/3309 [13:13:03<1:22:03, 14.96s/it] 90%|█████████ | 2981/3309 [13:13:19<1:24:09, 15.39s/it] 90%|█████████ | 2982/3309 [13:13:35<1:25:23, 15.67s/it] 90%|█████████ | 2983/3309 [13:13:49<1:22:45, 15.23s/it] 90%|█████████ | 2984/3309 [13:14:06<1:24:23, 15.58s/it] 90%|█████████ | 2985/3309 [13:14:22<1:25:51, 15.90s/it] 90%|█████████ | 2986/3309 [13:14:39<1:27:12, 16.20s/it] 90%|█████████ | 2987/3309 [13:14:53<1:23:20, 15.53s/it] 90%|█████████ | 2988/3309 [13:15:07<1:20:44, 15.09s/it] 90%|█████████ | 2989/3309 [13:15:24<1:22:27, 15.46s/it] 90%|█████████ | 2990/3309 [13:15:38<1:20:44, 15.19s/it]                                                        {'loss': 2.4922, 'grad_norm': 22.6779727935791, 'learning_rate': 2.418516508829e-07, 'epoch': 0.9}
+ 90%|█████████ | 2990/3309 [13:15:38<1:20:44, 15.19s/it] 90%|█████████ | 2991/3309 [13:15:53<1:19:50, 15.06s/it] 90%|█████████ | 2992/3309 [13:16:10<1:22:08, 15.55s/it] 90%|█████████ | 2993/3309 [13:16:26<1:23:35, 15.87s/it] 90%|█████████ | 2994/3309 [13:16:41<1:21:19, 15.49s/it] 91%|█████████ | 2995/3309 [13:16:56<1:19:46, 15.24s/it] 91%|█████████ | 2996/3309 [13:17:12<1:21:11, 15.56s/it] 91%|█████████ | 2997/3309 [13:17:28<1:22:03, 15.78s/it] 91%|█████████ | 2998/3309 [13:17:43<1:19:39, 15.37s/it] 91%|█████████ | 2999/3309 [13:17:59<1:20:55, 15.66s/it] 91%|█████████ | 3000/3309 [13:18:14<1:18:57, 15.33s/it]                                                        {'loss': 5.6454, 'grad_norm': 32.2912712097168, 'learning_rate': 2.270402339269162e-07, 'epoch': 0.91}
+ 91%|█████████ | 3000/3309 [13:18:14<1:18:57, 15.33s/it]/usr/local/lib/python3.12/dist-packages/torch/distributed/distributed_c10d.py:4814: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/usr/local/lib/python3.12/dist-packages/torch/utils/checkpoint.py:85: UserWarning: None of the inputs have requires_grad=True. Gradients will be None
+  warnings.warn(
+/workspace/src/qwen_vl/model/geometry_encoders/vggt_encoder.py:68: FutureWarning: `torch.cuda.amp.autocast(args...)` is deprecated. Please use `torch.amp.autocast('cuda', args...)` instead.
+  with torch.cuda.amp.autocast(dtype=dtype):
+ 91%|█████████ | 3001/3309 [13:19:23<2:41:23, 31.44s/it] 91%|█████████ | 3002/3309 [13:19:39<2:18:34, 27.08s/it] 91%|█████████ | 3003/3309 [13:19:54<1:58:34, 23.25s/it] 91%|█████████ | 3004/3309 [13:20:08<1:44:42, 20.60s/it] 91%|█████████ | 3005/3309 [13:20:23<1:35:15, 18.80s/it] 91%|█████████ | 3006/3309 [13:20:39<1:31:42, 18.16s/it] 91%|█████████ | 3007/3309 [13:20:56<1:29:06, 17.70s/it] 91%|█████████ | 3008/3309 [13:21:11<1:24:06, 16.77s/it] 91%|█████████ | 3009/3309 [13:21:27<1:23:38, 16.73s/it] 91%|█████████ | 3010/3309 [13:21:44<1:22:37, 16.58s/it]                                                        {'loss': 5.0056, 'grad_norm': 18.107574462890625, 'learning_rate': 2.126862680074643e-07, 'epoch': 0.91}
+ 91%|█████████ | 3010/3309 [13:21:44<1:22:37, 16.58s/it] 91%|█████████ | 3011/3309 [13:21:58<1:18:58, 15.90s/it] 91%|█████████ | 3012/3309 [13:22:12<1:15:50, 15.32s/it] 91%|█████████ | 3013/3309 [13:22:26<1:13:54, 14.98s/it] 91%|█████████ | 3014/3309 [13:22:42<1:15:32, 15.37s/it] 91%|█████████ | 3015/3309 [13:22:59<1:16:34, 15.63s/it] 91%|█████████ | 3016/3309 [13:23:15<1:17:25, 15.85s/it] 91%|█████████ | 3017/3309 [13:23:31<1:17:41, 15.97s/it] 91%|█████████ | 3018/3309 [13:23:45<1:14:59, 15.46s/it] 91%|█████████ | 3019/3309 [13:24:00<1:13:02, 15.11s/it] 91%|█████████▏| 3020/3309 [13:24:14<1:11:36, 14.87s/it]                                                        {'loss': 2.5369, 'grad_norm': 32.63033676147461, 'learning_rate': 1.9879112884043317e-07, 'epoch': 0.91}
+ 91%|█████████▏| 3020/3309 [13:24:14<1:11:36, 14.87s/it] 91%|█████████▏| 3021/3309 [13:24:30<1:13:26, 15.30s/it] 91%|█████████▏| 3022/3309 [13:24:47<1:14:44, 15.63s/it] 91%|█████████▏| 3023/3309 [13:25:03<1:15:30, 15.84s/it] 91%|█████████▏| 3024/3309 [13:25:20<1:16:24, 16.09s/it] 91%|█████████▏| 3025/3309 [13:25:36<1:16:58, 16.26s/it] 91%|█████████▏| 3026/3309 [13:25:53<1:16:51, 16.30s/it] 91%|█████████▏| 3027/3309 [13:26:09<1:17:08, 16.41s/it] 92%|█████████▏| 3028/3309 [13:26:26<1:16:43, 16.38s/it] 92%|█████████▏| 3029/3309 [13:26:42<1:16:47, 16.46s/it] 92%|█████████▏| 3030/3309 [13:26:59<1:16:14, 16.40s/it]                                                        {'loss': 2.4556, 'grad_norm': 18.089956283569336, 'learning_rate': 1.853561481667404e-07, 'epoch': 0.92}
+ 92%|█████████▏| 3030/3309 [13:26:59<1:16:14, 16.40s/it] 92%|█████████▏| 3031/3309 [13:27:13<1:13:25, 15.85s/it] 92%|█████████▏| 3032/3309 [13:27:31<1:15:15, 16.30s/it] 92%|█████████▏| 3033/3309 [13:27:47<1:14:57, 16.29s/it] 92%|█████████▏| 3034/3309 [13:28:01<1:11:54, 15.69s/it] 92%|█████████▏| 3035/3309 [13:28:20<1:15:52, 16.61s/it] 92%|█████████▏| 3036/3309 [13:28:36<1:15:09, 16.52s/it] 92%|█████████▏| 3037/3309 [13:28:50<1:11:50, 15.85s/it] 92%|█████████▏| 3038/3309 [13:29:07<1:12:42, 16.10s/it] 92%|█████████▏| 3039/3309 [13:29:21<1:09:57, 15.55s/it] 92%|█████████▏| 3040/3309 [13:29:38<1:10:46, 15.79s/it]                                                        {'loss': 3.0884, 'grad_norm': 13.772138595581055, 'learning_rate': 1.7238261362469256e-07, 'epoch': 0.92}
+ 92%|█████████▏| 3040/3309 [13:29:38<1:10:46, 15.79s/it] 92%|█████████▏| 3041/3309 [13:29:54<1:11:18, 15.96s/it] 92%|█████████▏| 3042/3309 [13:30:11<1:11:40, 16.11s/it] 92%|█████████▏| 3043/3309 [13:30:24<1:08:25, 15.43s/it] 92%|█████████▏| 3044/3309 [13:30:41<1:09:27, 15.73s/it] 92%|█████████▏| 3045/3309 [13:30:58<1:10:26, 16.01s/it] 92%|█████████▏| 3046/3309 [13:31:12<1:08:24, 15.61s/it] 92%|█████████▏| 3047/3309 [13:31:26<1:06:21, 15.20s/it] 92%|█████████▏| 3048/3309 [13:31:45<1:10:43, 16.26s/it] 92%|█████████▏| 3049/3309 [13:32:02<1:10:39, 16.31s/it] 92%|█████████▏| 3050/3309 [13:32:16<1:07:46, 15.70s/it]                                                        {'loss': 3.2805, 'grad_norm': 22.537776947021484, 'learning_rate': 1.5987176862657883e-07, 'epoch': 0.92}
+ 92%|█████████▏| 3050/3309 [13:32:16<1:07:46, 15.70s/it] 92%|█████████▏| 3051/3309 [13:32:30<1:05:33, 15.25s/it] 92%|█████████▏| 3052/3309 [13:32:46<1:06:40, 15.57s/it] 92%|█████████▏| 3053/3309 [13:33:01<1:04:46, 15.18s/it] 92%|█████████▏| 3054/3309 [13:33:17<1:05:54, 15.51s/it] 92%|█████████▏| 3055/3309 [13:33:31<1:04:04, 15.13s/it] 92%|█████████▏| 3056/3309 [13:33:48<1:05:18, 15.49s/it] 92%|█████████▏| 3057/3309 [13:34:02<1:03:28, 15.11s/it] 92%|█████████▏| 3058/3309 [13:34:18<1:04:45, 15.48s/it] 92%|█████████▏| 3059/3309 [13:34:35<1:05:57, 15.83s/it] 92%|█████████▏| 3060/3309 [13:34:49<1:04:02, 15.43s/it]                                                        {'loss': 3.2507, 'grad_norm': 30.13243865966797, 'learning_rate': 1.4782481223949597e-07, 'epoch': 0.92}
+ 92%|█████████▏| 3060/3309 [13:34:49<1:04:02, 15.43s/it] 93%|█████████▎| 3061/3309 [13:35:05<1:04:47, 15.67s/it] 93%|█████████▎| 3062/3309 [13:35:22<1:05:16, 15.85s/it] 93%|█████████▎| 3063/3309 [13:35:36<1:02:55, 15.35s/it] 93%|█████████▎| 3064/3309 [13:35:51<1:01:50, 15.14s/it] 93%|█████████▎| 3065/3309 [13:36:07<1:03:20, 15.58s/it] 93%|█████████▎| 3066/3309 [13:36:21<1:01:05, 15.08s/it] 93%|█████████▎| 3067/3309 [13:36:36<1:00:15, 14.94s/it] 93%|█████████▎| 3068/3309 [13:36:50<59:08, 14.72s/it]   93%|█████████▎| 3069/3309 [13:37:04<58:18, 14.58s/it] 93%|█████████▎| 3070/3309 [13:37:21<1:00:33, 15.20s/it]                                                        {'loss': 4.1981, 'grad_norm': 20.858510971069336, 'learning_rate': 1.3624289907042787e-07, 'epoch': 0.93}
+ 93%|█████████▎| 3070/3309 [13:37:21<1:00:33, 15.20s/it] 93%|█████████▎| 3071/3309 [13:37:35<58:43, 14.80s/it]   93%|█████████▎| 3072/3309 [13:37:49<57:45, 14.62s/it] 93%|█████████▎| 3073/3309 [13:38:04<57:37, 14.65s/it] 93%|█████████▎| 3074/3309 [13:38:20<59:17, 15.14s/it] 93%|█████████▎| 3075/3309 [13:38:35<58:26, 14.98s/it] 93%|█████████▎| 3076/3309 [13:38:51<59:52, 15.42s/it] 93%|█████████▎| 3077/3309 [13:39:07<1:00:41, 15.69s/it] 93%|█████████▎| 3078/3309 [13:39:24<1:01:11, 15.89s/it] 93%|█████████▎| 3079/3309 [13:39:40<1:01:28, 16.04s/it] 93%|█████████▎| 3080/3309 [13:39:55<59:30, 15.59s/it]                                                        {'loss': 4.9341, 'grad_norm': 30.669658660888672, 'learning_rate': 1.2512713915559027e-07, 'epoch': 0.93}
+ 93%|█████████▎| 3080/3309 [13:39:55<59:30, 15.59s/it] 93%|█████████▎| 3081/3309 [13:40:14<1:03:52, 16.81s/it] 93%|█████████▎| 3082/3309 [13:40:36<1:09:14, 18.30s/it] 93%|█████████▎| 3083/3309 [13:40:56<1:11:22, 18.95s/it] 93%|█████████▎| 3084/3309 [13:41:12<1:07:17, 17.95s/it] 93%|█████████▎| 3085/3309 [13:41:27<1:03:18, 16.96s/it] 93%|█████████▎| 3086/3309 [13:41:41<1:00:28, 16.27s/it] 93%|█████████▎| 3087/3309 [13:41:58<1:00:20, 16.31s/it] 93%|█████████▎| 3088/3309 [13:42:12<58:08, 15.78s/it]   93%|█████████▎| 3089/3309 [13:42:29<58:29, 15.95s/it] 93%|█████████▎| 3090/3309 [13:42:43<56:37, 15.51s/it]                                                      {'loss': 4.8266, 'grad_norm': 32.03891372680664, 'learning_rate': 1.1447859785403359e-07, 'epoch': 0.93}
+ 93%|█████████▎| 3090/3309 [13:42:43<56:37, 15.51s/it] 93%|█████████▎| 3091/3309 [13:42:57<54:59, 15.14s/it] 93%|█████████▎| 3092/3309 [13:43:14<56:10, 15.53s/it] 93%|█████████▎| 3093/3309 [13:43:29<54:57, 15.27s/it] 94%|█████████▎| 3094/3309 [13:43:43<53:39, 14.98s/it] 94%|█████████▎| 3095/3309 [13:43:59<55:06, 15.45s/it] 94%|█████████▎| 3096/3309 [13:44:16<56:09, 15.82s/it] 94%|█████████▎| 3097/3309 [13:44:30<54:12, 15.34s/it] 94%|█████████▎| 3098/3309 [13:44:45<52:48, 15.02s/it] 94%|█████████▎| 3099/3309 [13:45:02<54:38, 15.61s/it] 94%|█████████▎| 3100/3309 [13:45:16<52:58, 15.21s/it]                                                      {'loss': 3.4044, 'grad_norm': 18.382429122924805, 'learning_rate': 1.0429829574554573e-07, 'epoch': 0.94}
+ 94%|█████████▎| 3100/3309 [13:45:16<52:58, 15.21s/it] 94%|█████████▎| 3101/3309 [13:45:32<53:55, 15.56s/it] 94%|█████████▎| 3102/3309 [13:45:49<54:26, 15.78s/it] 94%|█████████▍| 3103/3309 [13:46:03<53:07, 15.47s/it] 94%|█████████▍| 3104/3309 [13:46:20<53:39, 15.71s/it] 94%|█████████▍| 3105/3309 [13:46:34<52:19, 15.39s/it] 94%|█████████▍| 3106/3309 [13:46:51<53:16, 15.74s/it] 94%|█████████▍| 3107/3309 [13:47:05<51:09, 15.20s/it] 94%|█████████▍| 3108/3309 [13:47:19<49:35, 14.80s/it] 94%|█████████▍| 3109/3309 [13:47:35<50:51, 15.26s/it] 94%|█████████▍| 3110/3309 [13:47:51<51:13, 15.45s/it]                                                      {'loss': 4.1438, 'grad_norm': 16.341550827026367, 'learning_rate': 9.458720853282977e-08, 'epoch': 0.94}
+ 94%|█████████▍| 3110/3309 [13:47:51<51:13, 15.45s/it] 94%|█████████▍| 3111/3309 [13:48:07<52:08, 15.80s/it] 94%|█████████▍| 3112/3309 [13:48:22<50:46, 15.46s/it] 94%|█████████▍| 3113/3309 [13:48:37<49:47, 15.24s/it] 94%|█████████▍| 3114/3309 [13:48:51<48:13, 14.84s/it] 94%|█████████▍| 3115/3309 [13:49:07<49:28, 15.30s/it] 94%|█████████▍| 3116/3309 [13:49:23<50:18, 15.64s/it] 94%|█████████▍| 3117/3309 [13:49:40<50:43, 15.85s/it] 94%|█████████▍| 3118/3309 [13:49:54<49:17, 15.48s/it] 94%|█████████▍| 3119/3309 [13:50:09<47:50, 15.11s/it] 94%|█████████▍| 3120/3309 [13:50:23<47:09, 14.97s/it]                                                      {'loss': 5.6917, 'grad_norm': 32.575286865234375, 'learning_rate': 8.534626694799485e-08, 'epoch': 0.94}
+ 94%|█████████▍| 3120/3309 [13:50:23<47:09, 14.97s/it] 94%|█████████▍| 3121/3309 [13:50:40<48:30, 15.48s/it] 94%|█████████▍| 3122/3309 [13:50:59<51:20, 16.47s/it] 94%|█████████▍| 3123/3309 [13:51:17<53:08, 17.14s/it] 94%|█████████▍| 3124/3309 [13:51:34<52:21, 16.98s/it] 94%|█████████▍| 3125/3309 [13:51:48<49:27, 16.13s/it] 94%|█████████▍| 3126/3309 [13:52:05<49:42, 16.30s/it] 94%|█████████▍| 3127/3309 [13:52:21<49:28, 16.31s/it] 95%|█████████▍| 3128/3309 [13:52:38<49:16, 16.34s/it] 95%|█████████▍| 3129/3309 [13:52:54<49:17, 16.43s/it] 95%|█████████▍| 3130/3309 [13:53:11<48:56, 16.41s/it]                                                      {'loss': 2.5437, 'grad_norm': 19.515989303588867, 'learning_rate': 7.657635666335317e-08, 'epoch': 0.95}
+ 95%|█████████▍| 3130/3309 [13:53:11<48:56, 16.41s/it] 95%|█████████▍| 3131/3309 [13:53:25<46:48, 15.78s/it] 95%|█████████▍| 3132/3309 [13:53:44<49:34, 16.81s/it] 95%|█████████▍| 3133/3309 [13:54:08<55:34, 18.94s/it] 95%|█████████▍| 3134/3309 [13:54:30<58:06, 19.92s/it] 95%|█████████▍| 3135/3309 [13:54:48<55:51, 19.26s/it] 95%|█████████▍| 3136/3309 [13:55:02<51:12, 17.76s/it] 95%|█████████▍| 3137/3309 [13:55:19<49:39, 17.32s/it] 95%|█████████▍| 3138/3309 [13:55:35<48:30, 17.02s/it] 95%|█████████▍| 3139/3309 [13:55:51<47:38, 16.81s/it] 95%|█████████▍| 3140/3309 [13:56:05<45:06, 16.02s/it]                                                      {'loss': 2.5297, 'grad_norm': 18.81734275817871, 'learning_rate': 6.827831820653163e-08, 'epoch': 0.95}
+ 95%|█████████▍| 3140/3309 [13:56:05<45:06, 16.02s/it] 95%|█████████▍| 3141/3309 [13:56:20<43:40, 15.60s/it] 95%|█████████▍| 3142/3309 [13:56:38<45:46, 16.45s/it] 95%|█████████▍| 3143/3309 [13:56:57<47:28, 17.16s/it] 95%|█████████▌| 3144/3309 [13:57:14<46:35, 16.94s/it] 95%|█████████▌| 3145/3309 [13:57:28<44:23, 16.24s/it] 95%|█████████▌| 3146/3309 [13:57:43<42:30, 15.65s/it] 95%|█████████▌| 3147/3309 [13:57:57<41:26, 15.35s/it] 95%|█████████▌| 3148/3309 [13:58:12<40:31, 15.11s/it] 95%|█████████▌| 3149/3309 [13:58:26<39:52, 14.95s/it] 95%|█████████▌| 3150/3309 [13:58:43<40:42, 15.36s/it]                                                      {'loss': 5.3046, 'grad_norm': 20.44892120361328, 'learning_rate': 6.045294687991643e-08, 'epoch': 0.95}
+ 95%|█████████▌| 3150/3309 [13:58:43<40:42, 15.36s/it] 95%|█████████▌| 3151/3309 [13:58:57<39:48, 15.12s/it] 95%|█████████▌| 3152/3309 [13:59:12<38:54, 14.87s/it] 95%|█████████▌| 3153/3309 [13:59:28<39:50, 15.32s/it] 95%|█████████▌| 3154/3309 [13:59:42<38:51, 15.04s/it] 95%|█████████▌| 3155/3309 [13:59:57<38:12, 14.89s/it] 95%|█████████▌| 3156/3309 [14:00:11<37:36, 14.75s/it] 95%|██████���██▌| 3157/3309 [14:00:26<37:17, 14.72s/it] 95%|█████████▌| 3158/3309 [14:00:42<38:10, 15.17s/it] 95%|█████████▌| 3159/3309 [14:00:59<39:03, 15.62s/it] 95%|█████████▌| 3160/3309 [14:01:13<38:03, 15.32s/it]                                                      {'loss': 7.1585, 'grad_norm': 30.222261428833008, 'learning_rate': 5.310099268443114e-08, 'epoch': 0.95}
+ 95%|█████████▌| 3160/3309 [14:01:13<38:03, 15.32s/it] 96%|█████████▌| 3161/3309 [14:01:30<38:30, 15.61s/it] 96%|█████████▌| 3162/3309 [14:01:44<37:34, 15.34s/it] 96%|█████████▌| 3163/3309 [14:02:01<38:07, 15.67s/it] 96%|█████████▌| 3164/3309 [14:02:17<38:33, 15.96s/it] 96%|█████████▌| 3165/3309 [14:02:32<37:14, 15.52s/it] 96%|█████████▌| 3166/3309 [14:02:49<38:15, 16.05s/it] 96%|█████████▌| 3167/3309 [14:03:06<38:37, 16.32s/it] 96%|█████████▌| 3168/3309 [14:03:22<38:17, 16.29s/it] 96%|█████████▌| 3169/3309 [14:03:37<36:36, 15.69s/it] 96%|█████████▌| 3170/3309 [14:03:53<36:50, 15.90s/it]                                                      {'loss': 3.9296, 'grad_norm': 22.93487548828125, 'learning_rate': 4.622316024765039e-08, 'epoch': 0.96}
+ 96%|█████████▌| 3170/3309 [14:03:53<36:50, 15.90s/it] 96%|█████████▌| 3171/3309 [14:04:09<36:54, 16.05s/it] 96%|█████████▌| 3172/3309 [14:04:26<36:52, 16.15s/it] 96%|█████████▌| 3173/3309 [14:04:42<36:46, 16.23s/it] 96%|█████████▌| 3174/3309 [14:04:59<36:36, 16.27s/it] 96%|█████████▌| 3175/3309 [14:05:15<36:20, 16.27s/it] 96%|█████████▌| 3176/3309 [14:05:29<34:44, 15.67s/it] 96%|█████████▌| 3177/3309 [14:05:44<33:49, 15.38s/it] 96%|█████████▌| 3178/3309 [14:06:00<34:09, 15.64s/it] 96%|█████████▌| 3179/3309 [14:06:14<32:59, 15.23s/it] 96%|█████████▌| 3180/3309 [14:06:29<32:04, 14.92s/it]                                                      {'loss': 3.2971, 'grad_norm': 20.129398345947266, 'learning_rate': 3.982010875626885e-08, 'epoch': 0.96}
+ 96%|█████████▌| 3180/3309 [14:06:29<32:04, 14.92s/it] 96%|█████████▌| 3181/3309 [14:06:45<32:41, 15.32s/it] 96%|█████████▌| 3182/3309 [14:06:59<31:54, 15.07s/it] 96%|█████████▌| 3183/3309 [14:07:16<32:25, 15.44s/it] 96%|█████████▌| 3184/3309 [14:07:30<31:22, 15.06s/it] 96%|█████████▋| 3185/3309 [14:07:44<30:51, 14.93s/it] 96%|█████████▋| 3186/3309 [14:08:01<31:42, 15.47s/it] 96%|█████████▋| 3187/3309 [14:08:15<30:42, 15.10s/it] 96%|█████████▋| 3188/3309 [14:08:31<30:56, 15.35s/it] 96%|█████████▋| 3189/3309 [14:08:46<30:00, 15.00s/it] 96%|█████████▋| 3190/3309 [14:09:02<30:42, 15.48s/it]                                                      {'loss': 4.1501, 'grad_norm': 20.64815330505371, 'learning_rate': 3.389245189292622e-08, 'epoch': 0.96}
+ 96%|█████████▋| 3190/3309 [14:09:02<30:42, 15.48s/it] 96%|█████████▋| 3191/3309 [14:09:19<30:58, 15.75s/it] 96%|█████████▋| 3192/3309 [14:09:35<31:04, 15.94s/it] 96%|█████████▋| 3193/3309 [14:09:51<31:02, 16.06s/it] 97%|█████████▋| 3194/3309 [14:10:09<31:28, 16.42s/it] 97%|█████████▋| 3195/3309 [14:10:25<31:05, 16.37s/it] 97%|█████████▋| 3196/3309 [14:10:39<29:53, 15.87s/it] 97%|█████████▋| 3197/3309 [14:10:54<28:58, 15.53s/it] 97%|█████████▋| 3198/3309 [14:11:10<29:06, 15.73s/it] 97%|█████████▋| 3199/3309 [14:11:25<28:13, 15.39s/it] 97%|█████████▋| 3200/3309 [14:11:41<28:30, 15.69s/it]                                                      {'loss': 4.9552, 'grad_norm': 19.435129165649414, 'learning_rate': 2.8440757777385976e-08, 'epoch': 0.97}
+ 97%|█████████▋| 3200/3309 [14:11:41<28:30, 15.69s/it] 97%|█████████▋| 3201/3309 [14:11:58<28:43, 15.95s/it] 97%|█████████▋| 3202/3309 [14:12:14<28:40, 16.08s/it] 97%|█████████▋| 3203/3309 [14:12:31<28:56, 16.38s/it] 97%|█████████▋| 3204/3309 [14:12:46<27:32, 15.74s/it] 97%|█████████▋| 3205/3309 [14:13:00<26:21, 15.20s/it] 97%|█████████▋| 3206/3309 [14:13:16<26:41, 15.55s/it] 97%|█████████▋| 3207/3309 [14:13:32<26:51, 15.80s/it] 97%|█████████▋| 3208/3309 [14:13:49<26:59, 16.03s/it] 97%|█████████▋| 3209/3309 [14:14:05<26:53, 16.13s/it] 97%|█████████▋| 3210/3309 [14:14:19<25:39, 15.55s/it]                                                      {'loss': 2.6329, 'grad_norm': 17.719867706298828, 'learning_rate': 2.3465548912088298e-08, 'epoch': 0.97}
+ 97%|█████████▋| 3210/3309 [14:14:19<25:39, 15.55s/it] 97%|█████████▋| 3211/3309 [14:14:36<25:57, 15.89s/it] 97%|█████████▋| 3212/3309 [14:14:50<24:51, 15.37s/it] 97%|█████████▋| 3213/3309 [14:15:05<24:04, 15.05s/it] 97%|█████████▋| 3214/3309 [14:15:21<24:35, 15.53s/it] 97%|█████████▋| 3215/3309 [14:15:36<23:54, 15.26s/it] 97%|█████████▋| 3216/3309 [14:15:51<23:22, 15.08s/it] 97%|█████████▋| 3217/3309 [14:16:05<22:45, 14.85s/it] 97%|█████████▋| 3218/3309 [14:16:19<22:23, 14.76s/it] 97%|█████████▋| 3219/3309 [14:16:36<22:50, 15.23s/it] 97%|█████████▋| 3220/3309 [14:16:52<23:13, 15.66s/it]                                                      {'loss': 4.0836, 'grad_norm': 21.178937911987305, 'learning_rate': 1.896730213207132e-08, 'epoch': 0.97}
+ 97%|█████████▋| 3220/3309 [14:16:52<23:13, 15.66s/it] 97%|█████████▋| 3221/3309 [14:17:09<23:16, 15.87s/it] 97%|█████████▋| 3222/3309 [14:17:25<23:11, 15.99s/it] 97%|█████████▋| 3223/3309 [14:17:41<23:03, 16.08s/it] 97%|█████████▋| 3224/3309 [14:17:56<21:59, 15.52s/it] 97%|█████████▋| 3225/3309 [14:18:10<21:13, 15.16s/it] 97%|█████████▋| 3226/3309 [14:18:24<20:35, 14.88s/it] 98%|█████████▊| 3227/3309 [14:18:40<20:57, 15.33s/it] 98%|█████████▊| 3228/3309 [14:18:57<21:12, 15.71s/it] 98%|█████████▊| 3229/3309 [14:19:13<21:13, 15.92s/it] 98%|█████████▊| 3230/3309 [14:19:28<20:17, 15.41s/it]                                                      {'loss': 2.397, 'grad_norm': 16.906330108642578, 'learning_rate': 1.4946448559270964e-08, 'epoch': 0.98}
+ 98%|█████████▊| 3230/3309 [14:19:28<20:17, 15.41s/it] 98%|█████████▊| 3231/3309 [14:19:42<19:39, 15.12s/it] 98%|█████████▊| 3232/3309 [14:19:57<19:19, 15.05s/it] 98%|█████████▊| 3233/3309 [14:20:12<18:51, 14.88s/it] 98%|█████████▊| 3234/3309 [14:20:28<19:09, 15.32s/it] 98%|█████████▊| 3235/3309 [14:20:44<19:16, 15.63s/it] 98%|█████████▊| 3236/3309 [14:21:01<19:16, 15.84s/it] 98%|█████████▊| 3237/3309 [14:21:15<18:34, 15.47s/it] 98%|█████████▊| 3238/3309 [14:21:30<17:57, 15.17s/it] 98%|█████████▊| 3239/3309 [14:21:46<18:12, 15.61s/it] 98%|█████████▊| 3240/3309 [14:22:01<17:28, 15.20s/it]                                                      {'loss': 4.2365, 'grad_norm': 23.301292419433594, 'learning_rate': 1.1403373561199583e-08, 'epoch': 0.98}
+ 98%|█████████▊| 3240/3309 [14:22:01<17:28, 15.20s/it] 98%|█████████▊| 3241/3309 [14:22:17<17:36, 15.54s/it] 98%|█████████▊| 3242/3309 [14:22:33<17:37, 15.78s/it] 98%|█████████▊| 3243/3309 [14:22:49<17:29, 15.91s/it] 98%|█████████▊| 3244/3309 [14:23:04<16:42, 15.42s/it] 98%|█████████▊| 3245/3309 [14:23:18<16:02, 15.05s/it] 98%|█████████▊| 3246/3309 [14:23:34<16:13, 15.45s/it] 98%|█████████▊| 3247/3309 [14:23:51<16:15, 15.74s/it] 98%|█████████▊| 3248/3309 [14:24:07<16:11, 15.93s/it] 98%|█████████▊| 3249/3309 [14:24:21<15:19, 15.33s/it] 98%|█████████▊| 3250/3309 [14:24:37<15:22, 15.64s/it]                                                      {'loss': 3.444, 'grad_norm': 20.07245635986328, 'learning_rate': 8.338416714013254e-09, 'epoch': 0.98}
+ 98%|█████████▊| 3250/3309 [14:24:37<15:22, 15.64s/it] 98%|█████████▊| 3251/3309 [14:24:52<14:50, 15.35s/it] 98%|█████████▊| 3252/3309 [14:25:06<14:19, 15.08s/it] 98%|█████████▊| 3253/3309 [14:25:21<13:49, 14.82s/it] 98%|█████████▊| 3254/3309 [14:25:39<14:39, 15.98s/it] 98%|█████████▊| 3255/3309 [14:25:54<14:02, 15.60s/it] 98%|█████████▊| 3256/3309 [14:26:09<13:30, 15.30s/it] 98%|█████████▊| 3257/3309 [14:26:23<12:58, 14.96s/it] 98%|█████████▊| 3258/3309 [14:26:37<12:32, 14.76s/it] 98%|█████████▊| 3259/3309 [14:26:53<12:41, 15.24s/it] 99%|█████████▊| 3260/3309 [14:27:10<12:42, 15.55s/it]                                                      {'loss': 5.5038, 'grad_norm': 16.27911949157715, 'learning_rate': 5.751871769965056e-09, 'epoch': 0.99}
+ 99%|█████████▊| 3260/3309 [14:27:10<12:42, 15.55s/it] 99%|█████████▊| 3261/3309 [14:27:26<12:38, 15.79s/it] 99%|█████████▊| 3262/3309 [14:27:40<11:59, 15.32s/it] 99%|█████████▊| 3263/3309 [14:27:57<11:58, 15.63s/it] 99%|█████████▊| 3264/3309 [14:28:13<11:48, 15.75s/it] 99%|█████████▊| 3265/3309 [14:28:29<11:41, 15.95s/it] 99%|█████████▊| 3266/3309 [14:28:45<11:29, 16.04s/it] 99%|█████████▊| 3267/3309 [14:29:00<10:51, 15.51s/it] 99%|█████████▉| 3268/3309 [14:29:14<10:20, 15.12s/it] 99%|█████████▉| 3269/3309 [14:29:28<09:55, 14.88s/it] 99%|█████████▉| 3270/3309 [14:29:45<09:59, 15.37s/it]                                                      {'loss': 4.1734, 'grad_norm': 21.404827117919922, 'learning_rate': 3.643986629253138e-09, 'epoch': 0.99}
+ 99%|█████████▉| 3270/3309 [14:29:45<09:59, 15.37s/it] 99%|█████████▉| 3271/3309 [14:30:01<09:51, 15.57s/it] 99%|█████████▉| 3272/3309 [14:30:17<09:44, 15.79s/it] 99%|█████████▉| 3273/3309 [14:30:32<09:16, 15.45s/it] 99%|█████████▉| 3274/3309 [14:30:46<08:47, 15.07s/it] 99%|█████████▉| 3275/3309 [14:31:02<08:44, 15.43s/it] 99%|█████████▉| 3276/3309 [14:31:16<08:17, 15.07s/it] 99%|█████████▉| 3277/3309 [14:31:33<08:13, 15.42s/it] 99%|█████████▉| 3278/3309 [14:31:47<07:50, 15.18s/it] 99%|█████████▉| 3279/3309 [14:32:04<07:45, 15.51s/it] 99%|█████████▉| 3280/3309 [14:32:18<07:21, 15.22s/it]                                                      {'loss': 4.9837, 'grad_norm': 32.63972473144531, 'learning_rate': 2.014963316257501e-09, 'epoch': 0.99}
+ 99%|█████████▉| 3280/3309 [14:32:18<07:21, 15.22s/it] 99%|█████████▉| 3281/3309 [14:32:33<07:00, 15.03s/it] 99%|█████████▉| 3282/3309 [14:32:52<07:18, 16.24s/it] 99%|█████████▉| 3283/3309 [14:33:06<06:49, 15.73s/it] 99%|█████████▉| 3284/3309 [14:33:21<06:25, 15.42s/it] 99%|█████████▉| 3285/3309 [14:33:37<06:16, 15.70s/it] 99%|█████████▉| 3286/3309 [14:33:52<05:50, 15.25s/it] 99%|█████████▉| 3287/3309 [14:34:06<05:29, 14.97s/it] 99%|█████████▉| 3288/3309 [14:34:22<05:24, 15.47s/it] 99%|█████████▉| 3289/3309 [14:34:39<05:16, 15.84s/it] 99%|█████████▉| 3290/3309 [14:34:53<04:50, 15.29s/it]                                                      {'loss': 4.9867, 'grad_norm': 19.831165313720703, 'learning_rate': 8.649579601810454e-10, 'epoch': 0.99}
+ 99%|█████████▉| 3290/3309 [14:34:53<04:50, 15.29s/it] 99%|█████████▉| 3291/3309 [14:35:07<04:29, 14.98s/it] 99%|█████████▉| 3292/3309 [14:35:24<04:21, 15.36s/it]100%|█████████▉| 3293/3309 [14:35:40<04:12, 15.76s/it]100%|█████████▉| 3294/3309 [14:35:57<03:59, 15.94s/it]100%|█████████▉| 3295/3309 [14:36:11<03:36, 15.48s/it]100%|█████████▉| 3296/3309 [14:36:28<03:25, 15.77s/it]100%|█████████▉| 3297/3309 [14:36:44<03:11, 15.93s/it]100%|█████████▉| 3298/3309 [14:36:58<02:49, 15.43s/it]100%|█████████▉| 3299/3309 [14:37:15<02:37, 15.78s/it]100%|█████████▉| 3300/3309 [14:37:29<02:17, 15.30s/it]                                                      {'loss': 3.3738, 'grad_norm': 21.53673553466797, 'learning_rate': 1.9408078008431587e-10, 'epoch': 1.0}
+100%|█████████▉| 3300/3309 [14:37:29<02:17, 15.30s/it]100%|█████████▉| 3301/3309 [14:37:44<02:01, 15.17s/it]100%|█████████▉| 3302/3309 [14:38:00<01:49, 15.61s/it]100%|█████████▉| 3303/3309 [14:38:17<01:35, 15.93s/it]100%|█████████▉| 3304/3309 [14:38:33<01:20, 16.06s/it]100%|█████████▉| 3305/3309 [14:38:48<01:02, 15.59s/it]100%|█████████▉| 3306/3309 [14:39:04<00:47, 15.81s/it]100%|█████████▉| 3307/3309 [14:39:19<00:30, 15.48s/it]100%|█████████▉| 3308/3309 [14:39:41<00:17, 17.51s/it]                                                      {'train_runtime': 52781.7624, 'train_samples_per_second': 4.013, 'train_steps_per_second': 0.063, 'train_loss': 4.4771003486744005, 'epoch': 1.0}
+100%|█████████▉| 3308/3309 [14:39:41<00:17, 17.51s/it]100%|█████████▉| 3308/3309 [14:39:41<00:15, 15.96s/it]
+[rank0]:[W128 08:29:46.269631443 ProcessGroupNCCL.cpp:1534] Warning: WARNING: destroy_process_group() was not called before program exit, which can leak resources. For more info, please see https://pytorch.org/docs/stable/distributed.html#shutdown (function operator())